学途智助
首页
分类
标签
关于网站
登录
eeettt123
2025-08-11
28
作者编辑
技术栈llm总结 2025年8月11日
1. 做项目 中船 rl 2. llm的workflow项目 3. leetcode hot100 4. 刷题 科目1 练车科目2 科目3 5. 学习 cs336的课程 要会手写flash attention 等五个作业 LLM 技术欠缺点 llm 继续预训练 Megatron 理论 PPO 不会手算, 几乎整个rl 不会手算 推荐系统项目怎么弄? 1. 你的技能盘点 ✅ 已掌握(可直接写进简历的) LLM 系统 & 工具链 Dify 全流程 LangChain(单机应用开发) vLLM 部署与并行化 FastAPI 封装推理服务 训练 / 微调 SFT(Alpaca 格式) RLHF 理论(DPO、RL 理论) RAG 理论 数据库接入(理论) HuggingFace 使用 Prompt 工程 基本提示词编写(但非精通) 评测 手写过评测代码 ❌ 缺口(影响大厂 LLM 岗竞争力) 训练进阶 QLoRA 实践 LLM 继续预训练(domain adaptation) Megatron-LM 分布式训练实践 RLHF 实操 PPO 手算推导 TRL 框架使用(trl库) 多模态能力 LLaVA、MiniGPT-4 这种多模态模型 检索优化 rerank、query rewrite 等优化手段 Prompt 高阶 结构化推理 / Few-shot CoT / Self-consistency 提示工程 工程扩展 RAG + 工具调用的综合 pipeline(端到端) 会 dify的全流程 SFT 只做过 Alpaca 格式 dpo等理论会 rl理论会 fastapi vllm 部署 并行化 langchain 其中数据库的rag 很明显理论会实操应该很简单 检索优化不会 手动写过评测代码 huggingface会 prompt提示词肯定是会写 但是不是大师不是精通 不会 多模态 PPO 不会手算, 几乎整个rl 不会手算 trl QLoRA 知道理论但是实践不会 llm 继续预训练实践 Megatron 理论 推荐系统项目怎么弄?
Python
赞
博客信息
作者
eeettt123
发布日期
2025-08-11
其他信息 : 其他三字母的人名首字母都是其他同学发布的哦