大模型 · 吃瓜群众

大模型

2025-03-09 1_大模型_LLMs_基础面

2025-03-09 10_LLMs_训练经验帖

2025-03-09 11_大模型_LLMs_langchain_面

2025-03-09 12_多轮对话中让AI保持长期记忆的8种优化方式篇

2025-03-09 13_基于langchain_RAG问答应用实战

2025-03-09 14_基于LLM_向量库的文档对话_经验面

2025-03-09 15_大模型_RAG_经验面

2025-03-09 16_LLM文档对话_pdf解析关键问题

2025-03-09 17_大模型_LLMs_RAG_版面分析_表格识别方法篇

2025-03-09 18_大模型_LLMs_RAG_版面分析_文本分块面

2025-03-09 19_大模型外挂知识库优化_如何利用大模型辅助召回

2025-03-09 2_Layer_normalization_篇

2025-03-09 20_大模型外挂知识库优化_负样本样本挖掘篇

2025-03-09 21_RAG_Retrieval_Augmented_Generation_评测面

2025-03-09 22_检索增强生成_RAG_优化策略篇

2025-03-09 23_大模型_LLMs_RAG_关键痛点及对应解决方案

2025-03-09 24_大模型_LLMs_RAG_优化策略_RAG_Fusion篇

2025-03-09 25_Graph_RAG_面_一种_基于知识图谱的大模型检索增强实现策略

2025-03-09 26_大模型_LLMs_参数高效微调_PEFT_面

2025-03-09 27_适配器微调_Adapter_tuning_篇

2025-03-09 28_提示学习_Prompting_篇

2025-03-09 29_LoRA_系列篇

2025-03-09 3_LLMs_激活函数篇

2025-03-09 30_如何使用_PEFT库_中_LoRA

2025-03-09 31_大模型_LLMs_推理面

2025-03-09 32_大模型_LLMs_增量预训练篇

2025-03-09 33_增量预训练_Pretrain_样本拼接篇

2025-03-09 34_基于lora的llama2二次预训练

2025-03-09 35_大模型_LLMs_评测面

2025-03-09 36_大模型_LLMs_强化学习面

2025-03-09 37_大模型_LLMs_强化学习_RLHF及其变种面

2025-03-09 38_大模型_LLMs_强化学习_PPO_面

2025-03-09 39_强化学习在自然语言处理下的应用篇

2025-03-09 4_Attention_升级面

2025-03-09 40_大模型_LLMs_训练集面

2025-03-09 41_大模型_LLMs_LLM生成SFT数据方法面

2025-03-09 42_大模型_LLMs_显存问题面

2025-03-09 43_显存优化策略篇

2025-03-09 44_大模型_LLMs_分布式训练面

2025-03-09 45_图解分布式训练_一_流水线并行_Pipeline_Parallelism

2025-03-09 46_图解分布式训练_二_nn_DataParallel篇

2025-03-09 47_图解分布式训练_三_nn_parallel_DistributedDataParallel

2025-03-09 48_图解分布式训练_四_torch_multiprocessing_详细解析

2025-03-09 49_图解分布式训练_五_AMP混合精度训练_详细解析

2025-03-09 5_transformers_操作篇

2025-03-09 50_图解分布式训练_六_Pytorch的_DeepSpeed_详细解析

2025-03-09 51_图解分布式训练_七_accelerate_分布式训练_详细解析

2025-03-09 52_图解分布式训练_八_ZeRO_学习

2025-03-09 53_大模型分布式训练故障恢复篇

2025-03-09 54_pytorch_分布式计算_坑_bug_梳理篇

2025-03-09 55_大模型_LLMs_agent_面

2025-03-09 56_LLMs_位置编码篇

2025-03-09 57_LLMs_Tokenizer_篇

2025-03-09 58_怎么让英文大语言模型支持中文_一_构建中文tokenization

2025-03-09 59_怎么让英文大语言模型支持中文_二_继续预训练篇

2025-03-09 6_LLMs_损失函数篇

2025-03-09 60_怎么让英文大语言模型支持中文_三_对预训练模型进行指令微调

2025-03-09 61_大模型_LLMs_加速篇

2025-03-09 62_LLMs_推理性能面

2025-03-09 63_LLM_大语言模型_部署加速方法_PagedAttention篇

2025-03-09 64_大模型推理加速工具_vLLM

2025-03-09 65_LLM_大语言模型_部署加速方法_Faster_Transformer篇

2025-03-09 66_纯Python超轻量高性能LLM推理框架_LightLLM

2025-03-09 67_LLM推理技术之StreamingLLM_如何拥有无限长生成能力

2025-03-09 68_SwiftInfer_大模型无限流式输入推理飙升46_打破多轮对话长度限制

2025-03-09 69_大模型幻觉_LLM_Hallucination_面

2025-03-09 70_大模型的幻觉问题篇

2025-03-09 71_如何缓解大模型幻觉

2025-03-09 72_LLMs_对比篇

2025-03-09 73_百川智能baichuan7B_13B_53B_baichuan2_总结篇

2025-03-09 74_LLaMA_常见面试题篇

2025-03-09 75_GPT_经验篇

2025-03-09 76_思维链_Chain_of_Thought_COT

2025-03-09 1000个DeepSeek神级提示词_让你轻松驾驭AI

2025-03-09 7_相似度函数篇

2025-03-09 77_思维链_Chain_of_Thought_COT_变体篇

2025-03-09 78_小样本提示学习篇

2025-03-09 79_LLMs_测试集_中_数据泄露_问题篇

2025-03-09 8_大模型_LLMs_进阶面

2025-03-09 80_MOE_Mixture_of_Experts_篇

2025-03-09 81_大模型蒸馏篇

2025-03-09 82_LLMs_浮点数篇

2025-03-09 83_自定义_CUDA_函数的轻量级包装器_bitsandbytes篇

2025-03-09 84_大模型_LLMs_软硬件配置面

2025-03-09 85_Token及模型参数准备篇

2025-03-09 86_多模态常见面试篇

2025-03-09 87_NLP_Trick_篇

2025-03-09 88_文本分类常见面试篇

2025-03-09 89_文本摘要常见面试篇

2025-03-09 9_大模型_LLMs_微调面

2025-03-09 90_命名实体识别常见面试篇

2025-03-09 91_向量检索常见面试篇

2025-03-09 92_LLMs_其他_Trick

2025-03-09 AI动态跟踪系列_四_DeepSeek引发广泛关注_大模型应用落地将加速

2025-03-09 AI事件点评_DeepSeek发布高性价比开源模型_有望拉平模型差距_加速AI云与应用发展

2025-03-09 AI行业点评_DeepSeek冲击全球_国产科技待重估

2025-03-09 DeepSeek_15天指导手册_从入门到精通

2025-03-09 DeepSeek_15天指导手册_从入门到精通

2025-03-09 DeepSeek_15天指导手册_从入门到精通

2025-03-09 DeepSeek_15天指导手册_从入门到精通