PromptsVault AI is thinking...

Searching the best prompts from our community

ChatGPTMidjourneyClaude

AI/ML Prompts

Top-rated prompts for AI/ML

CategoryBrowsing AI/ML prompts

68Prompts Found

AI/ML

Nano

Production LLM fine-tuning pipeline with LoRA

Build enterprise-grade LLM fine-tuning system. Pipeline: 1. Implement data preprocessing and quality validation. 2. Set up LoRA (Low-Rank Adaptation) for efficient training. 3. Configure distributed training across multiple GPUs. 4. Implement gradient checkpointing for memory optimization. 5. Add automated evaluation with ROUGE, BLEU, and custom metrics. 6. Create A/B testing framework for model comparison. 7. Set up MLflow for experiment tracking. 8. Implement model versioning and deployment pipeline. Include cost monitoring and training time optimization.

#llm #fine-tuning #lora

AI/ML

Nano

Fine-tuning BERT for custom sentiment analysis

Fine-tune BERT model for custom sentiment analysis. Steps: 1. Data preprocessing (tokenize, pad, mask). 2. Load pre-trained BERT model (Hugging Face Transformers). 3. Define custom classification head. 4. Configure optimizer (AdamW) and scheduler. 5. Implement training loop with validation. 6. Handle class imbalance (weighted loss). 7. Evaluate metrics (F1-score, accuracy). 8. Quantize model for inference efficiency. Include usage example.

#ai-ml #bert #nlp

AI/ML

Nano

Machine learning model selection optimization

Master systematic model selection and optimization for machine learning projects with performance evaluation frameworks. Model selection process: 1. Problem definition: classification vs. regression, supervised vs. unsupervised learning. 2. Data assessment: sample size (minimum 1000 for deep learning), feature count, missing values analysis. 3. Baseline models: linear regression, logistic regression, random forest for initial benchmarks. Algorithm comparison: 1. Tree-based: Random Forest (high interpretability), XGBoost (competition winner), LightGBM (fast training). 2. Linear models: Ridge/Lasso (regularization), ElasticNet (feature selection), SGD (large datasets). 3. Neural networks: MLPs (tabular data), CNNs (images), RNNs/Transformers (sequences). Hyperparameter optimization: 1. Grid search: exhaustive parameter combinations, computationally expensive but thorough. 2. Random search: efficient for high-dimensional spaces, 60% less computation time. 3. Bayesian optimization: intelligent search using Gaussian processes, tools like Optuna, Hyperopt. Cross-validation strategies: 1. K-fold CV: k=5 for small datasets, k=10 for larger datasets, stratified for imbalanced data. 2. Time series CV: walk-forward validation, expanding window, respect temporal order. Performance metrics: accuracy (>85% target), precision/recall (F1 >0.8), AUC-ROC (>0.9 excellent), confusion matrix analysis for class-specific performance.

#machine-learning #model-selection #hyperparameter-optimization

AI/ML

Nano

MLOps machine learning deployment pipelines

Implement MLOps practices for scalable machine learning deployment, monitoring, and lifecycle management. MLOps pipeline stages: 1. Data versioning: DVC (Data Version Control), data lineage tracking, feature store management. 2. Model training: automated retraining, hyperparameter optimization, experiment tracking with MLflow. 3. Model validation: A/B testing, shadow deployments, performance regression testing. 4. Deployment: containerized models (Docker), API serving (FastAPI, Flask), batch prediction jobs. Model serving strategies: 1. REST API: synchronous predictions, load balancing, auto-scaling based on request volume. 2. Batch inference: scheduled jobs, distributed processing with Spark, large dataset processing. 3. Real-time streaming: Kafka integration, low-latency predictions (<100ms), edge deployment. Monitoring and observability: 1. Data drift detection: statistical tests, distribution comparison, feature drift alerts. 2. Model performance: accuracy degradation monitoring, prediction confidence tracking. 3. Infrastructure metrics: CPU/memory usage, request latency, error rates, throughput monitoring. ML infrastructure: 1. Feature stores: centralized feature management, real-time/batch serving, feature lineage. 2. Model registry: versioning, metadata storage, deployment approval workflows. 3. Experiment tracking: hyperparameter logging, metric comparison, reproducible results. CI/CD for ML: 1. Automated testing: unit tests for preprocessing, integration tests for pipelines. 2. Model validation: holdout testing, cross-validation, business metric validation. Tools: Kubeflow for Kubernetes, SageMaker for AWS, Azure ML, Google AI Platform, target deployment time <30 minutes.

#mlops #ml-deployment #model-serving

AI/ML

Ensemble methods random forest gradient boosting

Master ensemble learning techniques combining multiple models for improved prediction accuracy and robustness. Ensemble strategies: 1. Bagging: bootstrap aggregating, parallel model training, variance reduction. 2. Boosting: sequential model training, error correction, bias reduction. 3. Stacking: meta-learner on base model predictions, cross-validation for meta-features. Random Forest implementation: 1. Hyperparameters: n_estimators=100-500, max_depth=10-20, min_samples_split=2-10. 2. Feature randomness: sqrt(n_features) for classification, n_features/3 for regression. 3. Out-of-bag evaluation: unbiased performance estimate, feature importance calculation. Gradient boosting algorithms: 1. XGBoost: extreme gradient boosting, regularization, parallel processing, GPU support. 2. LightGBM: leaf-wise tree growth, faster training, memory efficient, categorical features. 3. CatBoost: categorical feature handling, symmetric trees, reduced overfitting. Advanced ensemble techniques: 1. Voting classifiers: hard voting (majority), soft voting (probability averaging). 2. Blending: holdout set for meta-model training, simple weighted averaging. 3. Multi-level stacking: multiple meta-learner layers, cross-validation for each level. Feature importance: 1. Permutation importance: feature shuffling, performance degradation measurement. 2. SHAP values: unified feature importance, individual prediction explanations. 3. Gain-based importance: tree-based importance, feature split contribution. Hyperparameter optimization: grid search, randomized search, Bayesian optimization (Optuna), early stopping for boosting methods, validation curves for learning rate and regularization analysis.

#ensemble-methods #random-forest #gradient-boosting

AI/ML

Nano

AI safety robustness adversarial attacks defense

Implement AI safety measures including robustness testing, adversarial attack detection, and defense mechanisms for secure AI systems. Adversarial attacks: 1. FGSM (Fast Gradient Sign Method): single-step attack, epsilon perturbation, white-box scenario. 2. PGD (Projected Gradient Descent): iterative attack, stronger than FGSM, constrained optimization. 3. C&W attack: optimization-based, minimal distortion, confidence-based objective function. Defense mechanisms: 1. Adversarial training: include adversarial examples in training, robustness improvement, min-max optimization. 2. Defensive distillation: temperature scaling, smooth gradients, gradient masking prevention. 3. Input preprocessing: denoising, compression, randomized smoothing, transformation-based defenses. Robustness evaluation: 1. Certified defenses: mathematical guarantees, interval bound propagation, certified accuracy. 2. Empirical robustness: attack success rate, perturbation budget analysis, multiple attack types. 3. Natural robustness: corruption robustness, out-of-distribution generalization, real-world noise. Detection methods: 1. Statistical tests: input distribution analysis, feature statistics, anomaly detection. 2. Uncertainty quantification: prediction confidence, ensemble disagreement, Bayesian approaches. 3. Intrinsic dimensionality: manifold learning, adversarial subspace detection. Safety frameworks: 1. Alignment research: reward modeling, human feedback, value alignment, goal specification. 2. Interpretability: decision transparency, explanation generation, bias detection. 3. Monitoring systems: drift detection, performance degradation, safety constraints. Red teaming: systematic testing, failure mode discovery, stress testing, security assessment protocols, continuous monitoring for emerging threats and vulnerabilities.

#ai-safety #adversarial-attacks #robustness

AI/ML

AI ethics bias detection fairness algorithms

Implement ethical AI practices with bias detection, fairness assessment, and responsible machine learning development. Bias detection methods: 1. Statistical parity: equal positive prediction rate across groups, demographic parity constraint. 2. Equalized odds: equal true positive and false positive rates across groups. 3. Individual fairness: similar individuals receive similar predictions, Lipschitz constraint. 4. Counterfactual fairness: predictions unchanged in counterfactual world without sensitive attributes. Data bias assessment: 1. Representation bias: underrepresented groups in training data, sampling strategies. 2. Historical bias: past discriminatory practices encoded in data, temporal analysis. 3. Measurement bias: different data quality across groups, feature reliability assessment. Fairness metrics: 1. Demographic parity: P(Y_hat=1|A=0) = P(Y_hat=1|A=1), group-level fairness. 2. Equal opportunity: TPR consistency across groups, focus on positive outcomes. 3. Calibration: prediction confidence matches actual outcomes across groups. Mitigation strategies: 1. Pre-processing: data augmentation, re-sampling, synthetic data generation (SMOTE). 2. In-processing: fairness constraints during training, adversarial debiasing. 3. Post-processing: threshold adjustment, prediction calibration, outcome redistribution. Explainable AI (XAI): 1. LIME: local interpretable model-agnostic explanations, feature importance visualization. 2. SHAP: unified framework, game theory approach, additive feature attributions. 3. Attention mechanisms: model-internal explanations, highlight important input regions. Governance framework: ethics review board, algorithmic impact assessments, regular auditing (quarterly), documentation requirements, stakeholder involvement in design process.

#ai-ethics #bias-detection #fairness

AI/ML

Nano

Model evaluation validation metrics frameworks

Implement comprehensive model evaluation and validation frameworks with proper metrics and statistical analysis. Classification metrics: 1. Accuracy: correct predictions / total predictions, baseline comparison, stratified sampling. 2. Precision: true positives / (true positives + false positives), minimize false alarms. 3. Recall (Sensitivity): true positives / (true positives + false negatives), capture all positive cases. 4. F1-score: harmonic mean of precision and recall, balanced metric for imbalanced datasets. Regression metrics: 1. Mean Absolute Error (MAE): average absolute differences, interpretable units, robust to outliers. 2. Root Mean Square Error (RMSE): penalizes large errors, same units as target variable. 3. R² (coefficient of determination): explained variance, 1.0 = perfect fit, negative = worse than mean. Advanced evaluation: 1. ROC-AUC: area under ROC curve, threshold-independent, >0.9 excellent performance. 2. Precision-Recall curve: imbalanced datasets, focus on positive class performance. 3. Confusion matrix: detailed error analysis, class-specific performance, misclassification patterns. Cross-validation strategies: 1. Stratified K-fold: maintain class distribution, k=5 or k=10, repeated CV for stability. 2. Time series validation: walk-forward, expanding window, respect temporal dependencies. 3. Leave-one-out: small datasets, computationally expensive, unbiased estimates. Statistical significance: 1. Paired t-test: compare model performance, statistical significance p<0.05. 2. Bootstrap sampling: confidence intervals, performance stability assessment. 3. McNemar's test: classifier comparison, statistical hypothesis testing. Business metrics integration: ROI calculation, cost-benefit analysis, domain-specific targets, A/B testing framework for production validation.

#model-evaluation #validation-metrics #cross-validation

AI/ML

Nano

Natural language processing NLP pipelines

Build comprehensive NLP pipelines for text analysis, sentiment analysis, and language understanding tasks. Text preprocessing pipeline: 1. Data cleaning: remove HTML tags, normalize Unicode, handle encoding issues. 2. Tokenization: word-level, subword (BPE, SentencePiece), sentence segmentation. 3. Normalization: lowercase conversion, stopword removal, stemming/lemmatization. 4. Feature extraction: TF-IDF (max_features=10000), n-grams (1-3), word embeddings (Word2Vec, GloVe). Traditional NLP approaches: 1. Bag of Words: document-term matrix, sparse representation, baseline for classification. 2. Named Entity Recognition: spaCy, NLTK for entity extraction, custom entity types. 3. Part-of-speech tagging: grammatical analysis, dependency parsing, syntactic features. Modern approaches: 1. Pre-trained transformers: BERT (bidirectional), RoBERTa (optimized BERT), DistilBERT (lightweight). 2. Fine-tuning: task-specific adaptation, learning rate 5e-5, batch size 16-32. 3. Prompt engineering: few-shot learning, in-context learning, chain-of-thought prompting. Sentiment analysis: 1. Lexicon-based: VADER sentiment, TextBlob polarity scores, domain-specific dictionaries. 2. Machine learning: feature engineering, SVM/Random Forest classifiers, cross-validation. 3. Deep learning: LSTM with attention, BERT classification, multilingual models. Evaluation metrics: accuracy >80% for sentiment, F1 score >0.75, BLEU score for generation, perplexity for language models.

#nlp #natural-language-processing #sentiment-analysis

AI/ML

Federated learning privacy-preserving ML distributed

Implement federated learning systems for privacy-preserving machine learning across distributed data sources. Federated learning architecture: 1. Central server: model aggregation, global model updates, coordination protocol. 2. Client devices: local training, gradient computation, privacy preservation techniques. 3. Communication protocol: secure aggregation, differential privacy, encrypted gradients. Training process: 1. Model distribution: send global model to participating clients, version synchronization. 2. Local training: client-specific data, personalized updates, local epochs (5-10). 3. Aggregation: FedAvg (weighted averaging), secure aggregation, Byzantine fault tolerance. Privacy techniques: 1. Differential privacy: noise addition, privacy budget (ε=1-10), privacy accounting. 2. Secure multi-party computation: gradient sharing without data exposure, cryptographic protocols. 3. Homomorphic encryption: computation on encrypted data, privacy-preserving aggregation. Data heterogeneity: 1. Non-IID data: statistical heterogeneity, system heterogeneity, client drift. 2. Personalization: per-client adaptation, meta-learning approaches, personalized layers. 3. Clustering: client clustering, similar data distribution grouping, hierarchical federated learning. System challenges: 1. Communication efficiency: gradient compression, sparse updates, periodic aggregation. 2. Fault tolerance: client dropout, partial participation, robust aggregation. 3. Scalability: thousands of clients, asynchronous updates, edge computing integration. Applications: 1. Mobile keyboard: next-word prediction, language modeling, user privacy. 2. Healthcare: medical imaging, cross-institutional collaboration, patient privacy. 3. Financial services: fraud detection, credit scoring, regulatory compliance. Evaluation: convergence analysis, privacy guarantees, communication costs, accuracy vs privacy trade-offs.

#federated-learning #privacy-preserving-ml #distributed-learning

AI/ML

Nano

Recommendation systems collaborative filtering algorithms

Build recommendation systems using collaborative filtering, content-based filtering, and hybrid approaches for personalization. Collaborative filtering approaches: 1. User-based CF: find similar users, recommend items liked by similar users, cosine similarity calculation. 2. Item-based CF: find similar items, recommend similar items to liked items, Pearson correlation. 3. Matrix factorization: SVD, NMF for dimensionality reduction, latent factor modeling. Content-based filtering: 1. Feature extraction: item attributes, TF-IDF for text features, categorical encoding. 2. Profile building: user preference vectors, weighted feature importance, learning user tastes. 3. Similarity computation: cosine similarity, Jaccard similarity, recommendation scoring. Deep learning approaches: 1. Neural Collaborative Filtering: user/item embeddings, deep neural networks, non-linear interactions. 2. Deep autoencoders: collaborative denoising, missing rating prediction, feature learning. 3. Recurrent neural networks: sequential recommendations, session-based filtering, temporal dynamics. Hybrid systems: 1. Weighted combination: linear combination of different approaches, weight optimization. 2. Mixed systems: present recommendations from different algorithms, user choice. 3. Cascade systems: hierarchical filtering, primary and secondary recommendation stages. Evaluation metrics: 1. Precision@K: relevant items in top-K recommendations, practical relevance measure. 2. Recall@K: coverage of relevant items, completeness assessment. 3. NDCG (Normalized Discounted Cumulative Gain): ranking quality, position-aware evaluation. Cold start problem: new user recommendations, new item recommendations, demographic-based initialization, content-based bootstrap, popularity-based fallback strategies.

#recommendation-systems #collaborative-filtering #content-based-filtering

AI/ML

Clustering unsupervised learning segmentation analysis

Master clustering algorithms for customer segmentation, data exploration, and pattern discovery in unsupervised settings. K-Means clustering: 1. Algorithm implementation: centroid initialization, iterative assignment, convergence criteria. 2. Hyperparameter tuning: k selection using elbow method, silhouette score, gap statistic. 3. Preprocessing: feature scaling, standardization, handling categorical variables. Hierarchical clustering: 1. Agglomerative clustering: bottom-up approach, linkage criteria (ward, complete, average). 2. Dendrogram analysis: optimal cluster count, distance thresholds, visual interpretation. 3. Divisive clustering: top-down approach, computational complexity considerations. Density-based clustering: 1. DBSCAN: density-based spatial clustering, epsilon and min_samples parameters. 2. Outlier handling: noise point identification, varying density clusters. 3. HDBSCAN: hierarchical DBSCAN, cluster stability, automatic parameter selection. Advanced clustering: 1. Gaussian Mixture Models: probabilistic clustering, soft assignments, EM algorithm. 2. Spectral clustering: graph-based approach, non-convex clusters, similarity matrices. 3. Mean shift: mode-seeking algorithm, bandwidth selection, non-parametric density estimation. Cluster evaluation: 1. Internal measures: silhouette score (>0.5 good), Calinski-Harabasz index, Davies-Bouldin index. 2. External measures: adjusted rand index, normalized mutual information, homogeneity/completeness. 3. Visual validation: t-SNE plots, PCA visualization, cluster interpretation. Applications: customer segmentation (RFM analysis), market research, gene expression analysis, image segmentation, social network analysis, dimensionality reduction for visualization and preprocessing.

#clustering #unsupervised-learning #k-means

AI/ML

Deep learning neural network architectures

Design and implement deep learning architectures for various applications with optimization and regularization techniques. Neural network fundamentals: 1. Architecture design: input layer sizing, hidden layers (2-5 for most tasks), output layer activation functions. 2. Activation functions: ReLU for hidden layers, sigmoid/softmax for output, leaky ReLU for gradient problems. 3. Weight initialization: Xavier/Glorot for sigmoid/tanh, He initialization for ReLU networks. Convolutional Neural Networks (CNNs): 1. Architecture patterns: LeNet (digit recognition), AlexNet (ImageNet), ResNet (skip connections), EfficientNet (compound scaling). 2. Layer design: Conv2D (3x3 filters standard), MaxPooling (2x2), dropout (0.2-0.5), batch normalization. 3. Transfer learning: pre-trained models (ImageNet), fine-tuning last layers, feature extraction vs. full training. Recurrent Neural Networks (RNNs): 1. LSTM/GRU: sequential data processing, vanishing gradient solution, bidirectional architectures. 2. Attention mechanisms: self-attention, multi-head attention, transformer architecture. Regularization techniques: 1. Dropout: 20-50% during training, prevents overfitting, Monte Carlo dropout for uncertainty. 2. Batch normalization: normalize layer inputs, accelerated training, internal covariate shift reduction. 3. Early stopping: monitor validation loss, patience 10-20 epochs, save best model weights. Training optimization: Adam optimizer (lr=0.001), learning rate scheduling, gradient clipping for RNNs, mixed precision training for efficiency.

#deep-learning #neural-networks #cnn

AI/ML

Distributed machine learning parallel computing frameworks

Build distributed machine learning systems using parallel computing frameworks for large-scale model training and inference. Distributed training strategies: 1. Data parallelism: split data across workers, synchronize gradients, parameter servers or all-reduce. 2. Model parallelism: split model layers, pipeline parallelism, tensor parallelism for large models. 3. Hybrid approaches: combine data and model parallelism, heterogeneous cluster optimization. Synchronization methods: 1. Synchronous SGD: barrier synchronization, consistent updates, communication bottlenecks. 2. Asynchronous SGD: independent worker updates, stale gradients, convergence challenges. 3. Semi-synchronous: bounded staleness, backup workers, fault tolerance. Frameworks and tools: 1. Horovod: distributed deep learning, MPI backend, multi-GPU training, easy integration. 2. PyTorch Distributed: DistributedDataParallel, process groups, NCCL communication. 3. TensorFlow Strategy: MirroredStrategy, MultiWorkerMirroredStrategy, TPU integration. Communication optimization: 1. Gradient compression: sparsification, quantization, error compensation, communication reduction. 2. All-reduce algorithms: ring all-reduce, tree all-reduce, bandwidth optimization. 3. Overlapping: computation and communication overlap, pipeline optimization. Fault tolerance: 1. Checkpoint/restart: periodic model saving, failure recovery, elastic training. 2. Redundant workers: backup workers, speculative execution, dynamic resource allocation. 3. Preemptible instances: spot instance usage, cost optimization, interruption handling. Large model training: 1. Zero redundancy optimizer: ZeRO stages, memory optimization, trillion-parameter models. 2. Gradient checkpointing: memory-time trade-off, recomputation strategies. 3. Mixed precision: FP16/BF16 training, automatic loss scaling, hardware acceleration, training efficiency optimization for multi-node clusters.

#distributed-machine-learning #parallel-computing #horovod

AI/ML

AutoML automated machine learning optimization

Implement automated machine learning pipelines for efficient model development, hyperparameter optimization, and feature engineering. AutoML components: 1. Automated feature engineering: feature generation, selection, transformation, polynomial features. 2. Algorithm selection: model comparison, performance evaluation, meta-learning for algorithm recommendation. 3. Hyperparameter optimization: Bayesian optimization, genetic algorithms, random search, grid search. Popular AutoML frameworks: 1. Auto-sklearn: scikit-learn based, meta-learning, ensemble selection, 1-hour time budget. 2. H2O AutoML: distributed AutoML, automated feature engineering, model interpretability. 3. Google AutoML: cloud-based, neural architecture search, transfer learning capabilities. Neural Architecture Search (NAS): 1. Search space: architecture components, layer types, connection patterns, hyperparameters. 2. Search strategy: evolutionary algorithms, reinforcement learning, differentiable architecture search. 3. Performance estimation: early stopping, weight sharing, proxy tasks for efficiency. Automated feature engineering: 1. Feature synthesis: mathematical operations, aggregations, time-based features. 2. Feature selection: recursive elimination, correlation analysis, importance-based selection. 3. Feature transformation: scaling, encoding, polynomial features, interaction terms. Model selection and evaluation: 1. Cross-validation: stratified k-fold, time series validation, nested CV for unbiased estimates. 2. Ensemble methods: automated ensemble generation, stacking, blending, diversity optimization. 3. Performance monitoring: learning curves, validation curves, overfitting detection. Production deployment: automated model versioning, pipeline serialization, prediction API generation, monitoring integration, continuous retraining workflows based on performance degradation detection.

#automl #automated-machine-learning #hyperparameter-optimization

AI/ML

Nano

Speech recognition audio processing deep learning

Build speech recognition systems using deep learning for automatic speech recognition and audio processing applications. Audio preprocessing: 1. Signal processing: sampling rate 16kHz, windowing (Hamming, Hann), frame size 25ms, frame shift 10ms. 2. Feature extraction: MFCC (13 coefficients), log-mel filterbank, spectrograms, delta features. 3. Noise reduction: spectral subtraction, Wiener filtering, voice activity detection. Deep learning architectures: 1. Recurrent networks: LSTM/GRU for sequential modeling, bidirectional processing, attention mechanisms. 2. Transformer models: self-attention for audio sequences, positional encoding, parallel processing. 3. Conformer: convolution + transformer, local and global context modeling, state-of-the-art accuracy. End-to-end systems: 1. CTC (Connectionist Temporal Classification): alignment-free training, blank symbol, beam search decoding. 2. Attention-based encoder-decoder: seq2seq modeling, attention mechanisms, teacher forcing. 3. RNN-Transducer: streaming ASR, online decoding, real-time transcription. Language modeling: 1. N-gram models: statistical language modeling, smoothing techniques, vocabulary handling. 2. Neural language models: LSTM, Transformer-based, contextual understanding. 3. Shallow fusion: LM integration during decoding, score interpolation, beam search optimization. Advanced techniques: 1. Data augmentation: speed perturbation, noise addition, SpecAugment for robustness. 2. Multi-task learning: ASR + speaker recognition, emotion recognition, shared representations. 3. Transfer learning: pre-training on large datasets, fine-tuning for specific domains. Evaluation: Word Error Rate (WER <5% excellent), Real-Time Factor (RTF <0.1), confidence scoring, speaker adaptation for improved accuracy.

#speech-recognition #audio-processing #automatic-speech-recognition

AI/ML

Nano

Edge AI deployment optimization mobile inference

Optimize AI models for edge deployment with mobile inference, model compression, and real-time processing constraints. Model compression techniques: 1. Quantization: FP32 to INT8, post-training quantization, quantization-aware training. 2. Pruning: weight pruning, structured pruning, magnitude-based pruning, gradual sparsification. 3. Knowledge distillation: teacher-student training, soft targets, temperature scaling. Mobile optimization: 1. Model size constraints: <10MB for mobile apps, <100MB for edge devices. 2. Inference optimization: ONNX runtime, TensorFlow Lite, Core ML for iOS deployment. 3. Hardware acceleration: GPU inference, Neural Processing Units (NPU), specialized chips. Deployment frameworks: 1. TensorFlow Lite: mobile/embedded deployment, delegate acceleration, model optimization toolkit. 2. PyTorch Mobile: C++ runtime, operator support, optimization passes. 3. ONNX Runtime: cross-platform inference, hardware-specific optimizations. Real-time constraints: 1. Latency requirements: <100ms for interactive applications, <16ms for real-time video. 2. Memory constraints: RAM usage minimization, model partitioning, streaming inference. 3. Power efficiency: battery optimization, model scheduling, dynamic frequency scaling. Edge computing scenarios: 1. Computer vision: real-time object detection, image classification, pose estimation. 2. Natural language: on-device speech recognition, text classification, language translation. 3. IoT applications: sensor data processing, anomaly detection, predictive maintenance. Performance monitoring: 1. Inference speed: frames per second, latency percentiles, throughput measurement. 2. Accuracy preservation: model accuracy after compression, A/B testing, quality metrics. 3. Resource utilization: CPU/GPU usage, memory consumption, power draw monitoring, thermal management for sustained performance.

#edge-ai #mobile-inference #model-compression

AI/ML

Nano

Anomaly detection outlier analysis techniques

Implement anomaly detection systems for fraud detection, network security, and quality control applications. Statistical methods: 1. Z-score analysis: standard deviation-based detection, threshold ±3 for outliers. 2. Interquartile Range (IQR): Q3 + 1.5*IQR upper bound, Q1 - 1.5*IQR lower bound. 3. Modified Z-score: median-based, robust to outliers, threshold ±3.5. Machine learning approaches: 1. Isolation Forest: tree-based isolation, anomaly score calculation, contamination parameter tuning. 2. One-Class SVM: unsupervised learning, normal behavior boundary, nu parameter optimization. 3. Local Outlier Factor (LOF): density-based detection, local density comparison, k-nearest neighbors. Deep learning methods: 1. Autoencoders: reconstruction error-based detection, bottleneck representation, threshold tuning. 2. Variational Autoencoders (VAE): probabilistic approach, reconstruction probability, latent space analysis. 3. LSTM autoencoders: sequential data anomalies, time series patterns, prediction error analysis. Time series anomaly detection: 1. Prophet: trend and seasonality decomposition, confidence intervals, changepoint detection. 2. Seasonal decomposition: residual analysis, seasonal pattern deviations. 3. Moving averages: deviation from expected patterns, adaptive thresholds. Evaluation metrics: 1. Precision: true anomalies / detected anomalies, minimize false alarms. 2. Recall: detected anomalies / total anomalies, maximize anomaly capture. 3. F1-score: balanced precision and recall, compare different methods. Real-time detection: streaming data processing, concept drift adaptation, online learning algorithms, alert systems with severity levels, investigation workflows for detected anomalies.

#anomaly-detection #outlier-analysis #fraud-detection

AI/ML

Nano

Graph neural networks GNN social network analysis

Implement graph neural networks for social network analysis, knowledge graphs, and relational data modeling. Graph fundamentals: 1. Graph representation: adjacency matrix, edge list, node features, edge attributes. 2. Graph types: directed/undirected, weighted/unweighted, temporal, heterogeneous graphs. 3. Graph properties: degree distribution, clustering coefficient, path length, centrality measures. GNN architectures: 1. Graph Convolutional Networks (GCN): spectral approach, Laplacian matrix, localized filters. 2. GraphSAGE: inductive learning, neighbor sampling, mini-batch training on large graphs. 3. Graph Attention Networks (GAT): attention mechanism, node importance weighting, multi-head attention. Message passing: 1. Aggregation functions: mean, max, sum, attention-weighted aggregation. 2. Update functions: neural networks, gated updates, residual connections. 3. Multi-layer propagation: information propagation, over-smoothing prevention, layer normalization. Applications: 1. Node classification: user categorization, protein function prediction, document classification. 2. Graph classification: molecular properties, social network analysis, fraud detection. 3. Link prediction: friendship recommendation, drug-target interaction, knowledge graph completion. Social network analysis: 1. Community detection: modularity optimization, label propagation, community structure analysis. 2. Influence analysis: information diffusion, viral marketing, opinion dynamics modeling. 3. Centrality measures: betweenness, closeness, eigenvector centrality, PageRank algorithm. Implementation: PyTorch Geometric, DGL (Deep Graph Library), graph data loaders, mini-batch sampling, GPU acceleration for large graphs, scalability considerations for million-node networks.

#graph-neural-networks #gnn #social-network-analysis

AI/ML

Optimization algorithms gradient descent variants

Master optimization algorithms for machine learning including gradient descent variants and advanced optimization techniques. Gradient descent fundamentals: 1. Batch gradient descent: full dataset computation, stable convergence, slow for large datasets. 2. Stochastic gradient descent (SGD): single sample updates, noisy gradients, faster convergence. 3. Mini-batch gradient descent: compromise between batch and SGD, batch size 32-512. Advanced optimizers: 1. Momentum: velocity accumulation, β=0.9, overcomes local minima, accelerated convergence. 2. Adam: adaptive learning rates, β1=0.9, β2=0.999, bias correction, most popular choice. 3. RMSprop: adaptive learning rate, root mean square propagation, good for RNNs. Learning rate scheduling: 1. Step decay: reduce LR by factor (0.1) every epoch, plateau detection. 2. Cosine annealing: cyclical learning rate, warm restarts, exploration vs exploitation. 3. Exponential decay: gradual reduction, smooth convergence, fine-tuning applications. Second-order methods: 1. Newton's method: Hessian matrix, quadratic convergence, computational expensive. 2. Quasi-Newton methods: BFGS, L-BFGS for large-scale problems, approximated Hessian. 3. Natural gradients: Fisher information matrix, geometric optimization, natural parameter space. Regularization integration: 1. L1/L2 regularization: weight decay, sparsity promotion, overfitting prevention. 2. Elastic net: combined L1/L2, feature selection, ridge regression benefits. 3. Dropout: stochastic regularization, ensemble effect, neural network specific. Hyperparameter optimization: grid search, random search, Bayesian optimization, learning rate range test, cyclical learning rates, adaptive batch sizes for optimal convergence speed and stability.

#optimization-algorithms #gradient-descent #adam-optimizer

AI/ML

Feature engineering data preprocessing techniques

Master feature engineering and data preprocessing techniques for improved machine learning model performance. Data quality assessment: 1. Missing data analysis: missing completely at random (MCAR), missing at random (MAR), patterns identification. 2. Outlier detection: IQR method (Q1-1.5*IQR, Q3+1.5*IQR), Z-score (>3 standard deviations), isolation forest. 3. Data distribution: normality tests, skewness detection, transformation requirements. Feature transformation: 1. Numerical features: standardization (mean=0, std=1), min-max scaling [0,1], robust scaling for outliers. 2. Categorical features: one-hot encoding (cardinality <10), label encoding (ordinal), target encoding. 3. Text features: TF-IDF vectorization, word embeddings, n-gram features (1-3 grams). Advanced feature engineering: 1. Polynomial features: interaction terms, feature combinations, degree 2-3 maximum. 2. Temporal features: time-based features (hour, day, month), lag features, rolling statistics. 3. Domain-specific: geographical features (distance, coordinates), financial ratios, business metrics. Feature selection: 1. Statistical methods: chi-square test, correlation analysis (>0.8 correlation removal). 2. Model-based: feature importance from tree models, L1 regularization (Lasso). 3. Wrapper methods: recursive feature elimination, forward/backward selection. Dimensionality reduction: 1. PCA: variance retention 95%, principal component analysis, linear transformation. 2. t-SNE: non-linear visualization, perplexity tuning, high-dimensional data exploration. Validation: cross-validation for feature selection, target leakage prevention, temporal data splitting for time series.

#feature-engineering #data-preprocessing #feature-selection

AI/ML

Nano

Generative AI large language models LLM

Master generative AI and large language model development, fine-tuning, and deployment for various applications. LLM architecture fundamentals: 1. Transformer architecture: self-attention mechanism, multi-head attention, positional encoding. 2. Model scaling: parameter count (GPT-3: 175B), training data (tokens), computational requirements. 3. Architecture variants: encoder-only (BERT), decoder-only (GPT), encoder-decoder (T5). Pre-training strategies: 1. Data preparation: web crawling, deduplication, quality filtering, tokenization (BPE, SentencePiece). 2. Training objectives: next token prediction, masked language modeling, contrastive learning. 3. Infrastructure: distributed training, gradient accumulation, mixed precision (FP16/BF16). Fine-tuning approaches: 1. Supervised fine-tuning: task-specific datasets, learning rate 5e-5 to 1e-4, batch size 8-32. 2. Parameter-efficient fine-tuning: LoRA (Low-Rank Adaptation), adapters, prompt tuning. 3. Reinforcement Learning from Human Feedback (RLHF): reward modeling, PPO training. Prompt engineering: 1. Zero-shot prompting: task description without examples, clear instruction formatting. 2. Few-shot learning: 1-5 examples, in-context learning, demonstration selection strategies. 3. Chain-of-thought: step-by-step reasoning, intermediate steps, complex problem solving. Evaluation methods: 1. Perplexity: language modeling capability, lower is better, domain-specific evaluation. 2. BLEU score: text generation quality, n-gram overlap, reference comparison. 3. Human evaluation: quality, relevance, safety assessment, inter-rater reliability. Deployment considerations: inference optimization, model quantization, caching strategies, latency <1000ms target, cost optimization through batching.

#generative-ai #large-language-models #llm

AI/ML

Multi-modal AI vision language integration

Develop multi-modal AI systems integrating vision and language for comprehensive understanding and generation tasks. Multi-modal architecture: 1. Vision encoders: ResNet, EfficientNet, Vision Transformer for image feature extraction. 2. Language encoders: BERT, RoBERTa, T5 for text understanding, tokenization strategies. 3. Fusion strategies: early fusion (concatenation), late fusion (separate processing), attention-based fusion. Vision-Language models: 1. CLIP: contrastive learning, image-text pairs, zero-shot classification, semantic search. 2. DALL-E: text-to-image generation, autoregressive transformer, discrete VAE tokenization. 3. BLIP: bidirectional encoder, unified vision-language understanding, captioning and QA. Applications: 1. Image captioning: CNN-RNN architectures, attention mechanisms, beam search decoding. 2. Visual question answering: image understanding, question reasoning, answer generation. 3. Text-to-image generation: prompt engineering, style control, quality assessment. Cross-modal retrieval: 1. Image-text matching: similarity learning, triplet loss, hard negative mining. 2. Semantic search: joint embedding space, cosine similarity, ranking optimization. 3. Few-shot learning: prototype networks, meta-learning, domain adaptation. Training strategies: 1. Contrastive learning: InfoNCE loss, negative sampling, temperature scaling. 2. Masked modeling: masked language modeling, masked image modeling, unified objectives. 3. Multi-task learning: shared representations, task-specific heads, loss balancing. Evaluation: 1. Captioning: BLEU, METEOR, CIDEr scores, human evaluation for quality. 2. VQA accuracy: exact match, fuzzy matching, answer distribution analysis. 3. Retrieval: Recall@K, Mean Reciprocal Rank, cross-modal similarity analysis.

#multi-modal-ai #vision-language #image-captioning

AI/ML

Computer vision image processing deep learning

Implement computer vision solutions using deep learning for image classification, object detection, and visual analysis. Image preprocessing: 1. Data augmentation: rotation (±15°), horizontal flip, zoom (0.8-1.2x), brightness adjustment. 2. Normalization: pixel values [0,1], ImageNet normalization (mean=[0.485,0.456,0.406), std=[0.229,0.224,0.225]). 3. Resizing strategies: maintain aspect ratio, center cropping, padding to target size. Classification architectures: 1. ResNet: skip connections, deeper networks (50-152 layers), batch normalization. 2. EfficientNet: compound scaling, mobile-optimized, state-of-the-art accuracy/efficiency trade-off. 3. Vision Transformer (ViT): attention-based, patch embedding, competitive with CNNs. Object detection: 1. YOLO (You Only Look Once): real-time detection, single-stage detector, anchor boxes. 2. R-CNN family: two-stage detection, region proposals, high accuracy applications. 3. SSD (Single Shot Detector): multi-scale feature maps, speed/accuracy balance. Semantic segmentation: 1. U-Net: encoder-decoder, skip connections, medical imaging applications. 2. DeepLab: atrous convolution, conditional random fields, accurate boundary detection. Transfer learning: 1. ImageNet pre-training: feature extraction (freeze early layers), fine-tuning (unfreeze gradually). 2. Domain adaptation: medical images, satellite imagery, artistic style transfer. Evaluation metrics: top-1 accuracy (>90% excellent), mAP for detection (>0.5), IoU for segmentation (>0.7), inference time (<50ms for real-time applications).

#computer-vision #image-processing #object-detection

AI/ML

Reinforcement learning RL algorithms implementation

Implement reinforcement learning algorithms for decision-making, game playing, and optimization problems. RL fundamentals: 1. Markov Decision Process: states, actions, rewards, transition probabilities, discount factor (0.9-0.99). 2. Value functions: state-value V(s), action-value Q(s,a), Bellman equations, optimal policies. 3. Exploration vs exploitation: epsilon-greedy (ε=0.1), UCB, Thompson sampling strategies. Q-Learning implementation: 1. Q-table updates: Q(s,a) ← Q(s,a) + α[r + γ max Q(s',a') - Q(s,a)]. 2. Learning rate: α=0.1 to 0.01, decay schedule, convergence monitoring. 3. Experience replay: stored transitions, batch sampling, stable learning. Deep Q-Networks (DQN): 1. Neural network approximation: Q-function approximation, target network stabilization. 2. Double DQN: overestimation bias reduction, action selection vs evaluation separation. 3. Dueling DQN: value and advantage streams, better value estimates. Policy gradient methods: 1. REINFORCE: policy gradient theorem, Monte Carlo estimates, baseline subtraction. 2. Actor-Critic: policy (actor) and value function (critic), advantage estimation, A2C/A3C. 3. Proximal Policy Optimization (PPO): clipped objective, stable policy updates, trust region. Advanced algorithms: 1. Trust Region Policy Optimization (TRPO): constrained policy updates, KL divergence limits. 2. Soft Actor-Critic (SAC): off-policy, entropy maximization, continuous action spaces. Environment design: OpenAI Gym integration, custom environments, reward shaping, curriculum learning, multi-agent scenarios for complex interaction modeling.

#reinforcement-learning #q-learning #deep-q-network

AI/ML

Nano

AI model interpretability explainable machine learning

Implement model interpretability and explainable AI techniques for understanding machine learning model decisions and building trust. Interpretability types: 1. Global interpretability: overall model behavior, feature importance, decision boundary visualization. 2. Local interpretability: individual prediction explanations, instance-specific feature contributions. 3. Post-hoc interpretability: model-agnostic explanations, surrogate models, perturbation-based methods. LIME (Local Interpretable Model-agnostic Explanations): 1. Perturbation strategy: modify input features, observe prediction changes, local linear approximation. 2. Instance selection: neighborhood definition, sampling strategy, interpretable representation. 3. Explanation generation: simple model fitting, feature importance scores, visualization. SHAP (SHapley Additive exPlanations): 1. Game theory foundation: Shapley values, fair attribution, additive feature importance. 2. SHAP variants: TreeSHAP for tree models, KernelSHAP (model-agnostic), DeepSHAP for neural networks. 3. Visualization: waterfall plots, beeswarm plots, force plots, summary plots. Attention mechanisms: 1. Self-attention: transformer attention weights, token importance visualization. 2. Visual attention: CNN attention maps, grad-CAM, saliency maps for image models. 3. Attention interpretation: head analysis, layer-wise attention, attention rollout. Feature importance methods: 1. Permutation importance: feature shuffling, prediction degradation measurement, model-agnostic. 2. Integrated gradients: path integration, gradient-based attribution, baseline selection. 3. Ablation studies: feature removal, systematic evaluation, causal analysis. Model-specific interpretability: decision trees (rule extraction), linear models (coefficient analysis), ensemble methods (feature voting), deep learning (layer analysis), evaluation metrics for explanation quality and user trust assessment.

#model-interpretability #explainable-ai #lime

AI/ML

Nano

Time series forecasting LSTM ARIMA models

Build time series forecasting models using statistical methods and deep learning for accurate predictions. Time series analysis: 1. Stationarity testing: Augmented Dickey-Fuller test, p-value <0.05 for stationarity. 2. Differencing: first-order differencing, seasonal differencing, achieve stationarity. 3. Decomposition: trend, seasonality, residuals, STL decomposition, seasonal pattern identification. Classical methods: 1. ARIMA modeling: AutoRegressive Integrated Moving Average, parameter selection (p,d,q). 2. Seasonal ARIMA: SARIMA(p,d,q)(P,D,Q,s), seasonal parameters, model selection using AIC/BIC. 3. Exponential smoothing: Holt-Winters method, alpha/beta/gamma parameters, trend and seasonality. Deep learning approaches: 1. LSTM networks: sequence modeling, forget gate, input gate, output gate mechanisms. 2. GRU (Gated Recurrent Unit): simplified LSTM, fewer parameters, faster training. 3. Transformer models: attention mechanism for sequences, positional encoding, parallel processing. Feature engineering: 1. Lag features: previous values, window sizes 3-12 periods, correlation analysis. 2. Moving averages: simple MA, exponential MA, different window sizes (7, 30, 90 days). 3. Seasonal features: month, quarter, day of week, holiday indicators, cyclical encoding. Model evaluation: 1. Mean Absolute Error (MAE): average prediction error, interpretable units. 2. Root Mean Square Error (RMSE): penalize large errors, same units as target. 3. Mean Absolute Percentage Error (MAPE): percentage error, scale-independent, <10% excellent. Cross-validation: time series split, walk-forward validation, expanding window, out-of-sample testing for reliable performance assessment.

#time-series #forecasting #lstm

AI/ML

Transfer learning domain adaptation techniques

Master transfer learning and domain adaptation techniques for leveraging pre-trained models across different domains and tasks. Transfer learning strategies: 1. Feature extraction: freeze pre-trained layers, train classifier only, computational efficiency. 2. Fine-tuning: unfreeze layers gradually, lower learning rate (1e-5), task-specific adaptation. 3. Progressive unfreezing: layer-by-layer unfreezing, gradual adaptation, stability preservation. Pre-trained model selection: 1. Computer vision: ImageNet pre-training, ResNet/EfficientNet models, architecture matching. 2. Natural language: BERT/RoBERTa/GPT models, domain-specific pre-training, multilingual models. 3. Audio processing: wav2vec, speech pre-training, audio classification transfer. Domain adaptation methods: 1. Supervised adaptation: labeled target data, direct fine-tuning, small dataset scenarios. 2. Unsupervised adaptation: domain adversarial training, feature alignment, no target labels. 3. Semi-supervised: few labeled target samples, self-training, pseudo-labeling techniques. Advanced techniques: 1. Multi-task learning: shared representations, task-specific heads, joint optimization. 2. Meta-learning: few-shot adaptation, MAML (Model-Agnostic Meta-Learning), rapid adaptation. 3. Continual learning: catastrophic forgetting prevention, elastic weight consolidation. Domain shift handling: 1. Distribution mismatch: covariate shift, label shift, concept drift detection. 2. Feature alignment: maximum mean discrepancy (MMD), CORAL, deep domain confusion. 3. Adversarial adaptation: domain classifier, gradient reversal, minimax optimization. Evaluation strategies: target domain performance, source domain retention, adaptation speed, few-shot learning capabilities, cross-domain generalization assessment for robust transfer learning systems.

#transfer-learning #domain-adaptation #fine-tuning

AI/ML

Nano

Instructor structured LLM outputs

Get structured data from LLMs with Instructor. Pattern: 1. Define Pydantic models for output. 2. Use instructor.patch() on OpenAI client. 3. LLM returns validated objects. 4. Automatic retry on validation errors. 5. Partial streaming for progressive updates. 6. Union types for multiple formats. 7. Nested models for complex data. 8. Field descriptions guide LLM. Type-safe LLM outputs. Use for data extraction and classification.

#instructor #structured-outputs #pydantic

AI/ML

DALL-E 3 programmatic art creation

Create images with DALL-E 3 API. Features: 1. Enhanced prompt understanding. 2. Higher fidelity and detail. 3. Better text rendering in images. 4. Size options (1024x1024, 1792x1024). 5. Quality parameter (standard/hd). 6. Style parameter (vivid/natural). 7. Error handling for content policy. 8. Cost optimization strategies. Use detailed prompts and implement batch processing for multiple images.

#dalle-3 #openai #image-generation

AI/ML

Nano

LangChain agent orchestration

Build AI agents with LangChain. Components: 1. LLM wrapper (OpenAI, Anthropic, local). 2. Prompt templates with variables. 3. Chains for sequential operations. 4. Agents with tool selection. 5. Memory for conversation context. 6. Vector stores for embeddings. 7. Document loaders and splitters. 8. Output parsers for structured data. Use LCEL (LangChain Expression Language) for complex flows and implement human-in-the-loop patterns.

#langchain #agents #llm-orchestration

AI/ML

AutoGPT autonomous AI agents

Build autonomous agents with AutoGPT. Architecture: 1. Goal-oriented task decomposition. 2. Self-critique and iteration. 3. Memory management (short/long-term). 4. Tool usage (web search, file ops). 5. Code execution capability. 6. Human-in-loop checkpoints. 7. Budget constraints for API calls. 8. Plugin system for extensions. Agents plan and execute multi-step tasks independently.

#autogpt #autonomous-agents #agi

AI/ML

LangSmith LLM observability debugging

Debug LLM applications with LangSmith. Features: 1. Trace every LLM call. 2. View chain execution steps. 3. Latency and token analysis. 4. Error tracking and debugging. 5. Dataset creation from logs. 6. Evaluation and testing. 7. Feedback collection. 8. Cost monitoring. Essential for production LLM apps. Use to identify bottlenecks and optimize prompts.

#langsmith #observability #debugging

AI/ML

Nano

LlamaIndex document indexing RAG

Build RAG systems with LlamaIndex. Workflow: 1. Load documents (PDF, DOCX, web). 2. Node parser for chunking. 3. Create embeddings with LLM. 4. Build index (Vector, Tree, Keyword). 5. Query engine for retrieval. 6. Response synthesizer. 7. Sub-question query engine. 8. Chat engine for conversations. Use ServiceContext for configuration and implement hybrid retrieval.

#llamaindex #rag #document-indexing

AI/ML

Segment Anything Model image segmentation

Segment images with SAM. Usage: 1. Load SAM model (ViT-B, ViT-L, ViT-H). 2. Input image and prompts (points, boxes). 3. Automatic mask generation. 4. Multiple object segmentation. 5. Interactive refinement. 6. Binary mask output. 7. Integration with labeling tools. 8. Fine-tuning for specific domains. Use for instance segmentation, background removal, or dataset creation.

#sam #image-segmentation #computer-vision

AI/ML

ElevenLabs text-to-speech voices

Generate natural speech with ElevenLabs. API usage: 1. Choose voice from library. 2. Adjust stability and clarity. 3. Stream audio for low latency. 4. Voice cloning from samples. 5. Multiple languages support. 6. Emotion and style control. 7. SSML for pronunciation. 8. Webhook for long-form content. Implement audio caching and use websocket for real-time streaming.

#elevenlabs #text-to-speech #tts

AI/ML

Midjourney API prompt engineering

Master Midjourney prompts for art. Techniques: 1. Descriptive subject and style. 2. Parameters (--ar, --v, --s, --q). 3. Multi-prompts with :: weights. 4. Image prompts for style reference. 5. Negative weights to exclude. 6. Chaos for variety. 7. Stylize for artistic interpretation. 8. Seeds for reproducibility. Use /imagine command and iterate with variations.

#midjourney #prompt-engineering #ai-art

AI/ML

Nano

Stable Diffusion image generation API

Generate images with Stable Diffusion. Setup: 1. Load model with diffusers library. 2. Text-to-image with prompts. 3. Negative prompts for exclusions. 4. CFG scale for prompt adherence. 5. Steps and sampling method. 6. Image-to-image for variations. 7. Inpainting for edits. 8. ControlNet for guided generation. Use GPU acceleration and implement prompt engineering best practices.

#stable-diffusion #image-generation #diffusion-models

AI/ML

Chroma vector store local embeddings

Use ChromaDB for local vector storage. Setup: 1. Initialize persistent client. 2. Create collections with metadata. 3. Add documents with embeddings. 4. Query with similarity search. 5. Filter by metadata. 6. Update and delete operations. 7. Multiple embedding functions. 8. Export/import collections. Runs entirely local, no API needed. Use for privacy-sensitive applications.

#chromadb #vector-database #embeddings

AI/ML

Nano

Ollama local LLM deployment

Run LLMs locally with Ollama. Usage: 1. Install Ollama CLI. 2. Pull models (Llama 2, Mistral, CodeLlama). 3. Run with ollama run command. 4. API server for integrations. 5. Model customization with Modelfile. 6. Memory and GPU management. 7. Multi-model switching. 8. No internet required after download. Use for privacy, development, or air-gapped environments.

#ollama #local-llm #llama

AI/ML

Nano

OpenAI GPT-4 API integration patterns

Integrate GPT-4 API effectively. Patterns: 1. Chat completions with system/user messages. 2. Function calling for structured outputs. 3. Streaming responses for better UX. 4. Token counting to manage costs. 5. Temperature and top_p tuning. 6. Max tokens control. 7. Error handling and retries. 8. Rate limiting awareness. Use tiktoken for accurate token counts and implement caching for repeated queries.

#openai #gpt-4 #llm

AI/ML

Replicate AI model deployment

Deploy models with Replicate. Process: 1. Package model with Cog. 2. Define predict function. 3. Push to Replicate. 4. API access with predictions. 5. Automatic scaling. 6. GPU compute on-demand. 7. Webhook notifications. 8. Version management. Run any model without infrastructure. Use for Stable Diffusion, LLMs, or custom models.

#replicate #model-deployment #ml-ops

AI/ML

Nano

Vercel AI SDK streaming responses

Build AI apps with Vercel AI SDK. Features: 1. useChat hook for chat UI. 2. useCompletion for text generation. 3. Streaming responses with React Server Components. 4. Edge functions for low latency. 5. Multiple provider support (OpenAI, Anthropic). 6. Route handlers for API. 7. Streaming JSON for structured data. 8. Automatic loading states. Use streamText and implement function calling.

#vercel-ai-sdk #streaming #ai-ui

AI/ML

OpenRouter unified LLM API

Access multiple LLMs via OpenRouter. Benefits: 1. Single API for 50+ models. 2. Cost comparison across models. 3. Fallback to alternative models. 4. Real-time model availability. 5. Usage analytics dashboard. 6. OpenAI-compatible API. 7. Free models available. 8. Model routing based on performance. Switch models without code changes. Monitor costs and reliability.

#openrouter #llm-api #multi-model

AI/ML

Nano

Anthropic Claude prompt engineering

Optimize prompts for Claude. Techniques: 1. Use XML tags for structure (<document>, <instructions>). 2. Human/Assistant message format. 3. Chain-of-thought prompting. 4. Few-shot examples for context. 5. System prompts for behavior. 6. explicit instructions format. 7. Handle 100k+ token context. 8. Streaming for long outputs. Claude excels at following instructions precisely. Implement constitutional AI principles.

#anthropic #claude #prompt-engineering

AI/ML

Weaviate graph vector database

Implement Weaviate for semantic search. Features: 1. Schema definition for classes. 2. Automatic vectorization. 3. GraphQL API for queries. 4. Hybrid search (vector + keyword). 5. Cross-references between objects. 6. Generative search with LLMs. 7. Multi-tenancy support. 8. Modules for ML models. Use for knowledge graphs with semantic capabilities and implement question answering.

#weaviate #graph-database #vector-search

AI/ML

Nano

GPT-4 Vision image analysis

Analyze images with GPT-4 Vision. Use cases: 1. Image description and captioning. 2. OCR and text extraction. 3. Object detection and counting. 4. Visual question answering. 5. Chart and graph interpretation. 6. UI/UX analysis. 7. Product identification. 8. Accessibility alt-text generation. Pass image URLs or base64. Combine with text for context-aware analysis.

#gpt-4-vision #image-analysis #ocr

AI/ML

Nano

Pinecone vector database RAG system

Implement RAG with Pinecone. Architecture: 1. Document chunking and embedding. 2. Store embeddings in Pinecone index. 3. Semantic search with similarity. 4. Metadata filtering for context. 5. Hybrid search (dense + sparse). 6. Retrieve top-k relevant chunks. 7. Augment prompt with context. 8. Generate answer with LLM. Use text-embedding-ada-002 and implement re-ranking for accuracy.

#pinecone #vector-database #rag

AI/ML

Gemini multimodal AI integration

Use Google's Gemini for multimodal AI. Capabilities: 1. Text and image input simultaneously. 2. Vision understanding for analysis. 3. Long context window (up to 1M tokens). 4. Function calling support. 5. Code generation and execution. 6. Gemini Pro vs Ultra models. 7. Streaming responses. 8. Safety settings configuration. Use for image captioning, OCR, and visual Q&A.

#gemini #google-ai #multimodal

AI/ML

Hugging Face Transformers fine-tuning

Fine-tune models with Hugging Face. Process: 1. Load pre-trained model and tokenizer. 2. Prepare dataset with train/val split. 3. Define training arguments (epochs, batch size, learning rate). 4. Use Trainer API for training loop. 5. Evaluate with metrics (accuracy, F1). 6. Save model and push to Hub. 7. Inference with pipeline(). 8. PEFT with LoRA for efficiency. Use accelerate for distributed training and implement gradient accumulation.

#huggingface #transformers #fine-tuning

1 2