如何转GenAI

转型 GenAI 的经验分享 🌟 最近有很多朋友表达了对进入 GenAI 领域的兴趣，特别是那些来自某大厂 S…

10月 20, 2024

5-7 分钟

转型 GenAI 的经验分享 🌟

最近有很多朋友表达了对进入 GenAI 领域的兴趣，特别是那些来自某大厂 SDE/DS 背景的朋友们。他们普遍感到一些焦虑，但实际上，他们的能力是相当强的。今天，我想分享一些个人的经验与理解，希望能为大家的转型之路提供参考。

理解 AI 角色的重要性 🎯

首先，必须注意到当前阶段，大部分 AI 公司的 SDE 仍然是核心角色。尽管 AI 能力非常重要，但开源生态已经非常成熟。即使想要从事模型或者研究方向的工作，我也建议大家不要急于求成。可以逐步过渡，从 SDE 转向 ML，是一个更加稳妥的路径。

确定转型的目的 ❓

接下来，要理清你从事 GenAI 的目的。是想了解未来的趋势，还是对技术本身感兴趣？如果你只是想了解一些高层次的信息，那么社交媒体就是最简单的方式。可以在 X 上关注一些干货满满的账号，培养你的信息来源。我个人不太推荐参加付费峰会，门票通常与收获不成比例，大牌演讲者分享的内容往往较为泛泛。

如果你确实对技术感兴趣，不妨参加一些免费的 AI 活动，如各类 AI hackathon 或开源项目的聚会。这类活动不仅能够让你与行业的实现者面对面交流，还能更真实地理解行业生态和现状。

探索 ML 推理基础设施 🔍

对于技术感兴趣的朋友，我非常推荐探索 ML inference 的基础设施。这一领域聚焦于如何高效地进行模型推理和部署，不需要很多 ML 知识。同时，它与 SDE 背景紧密相关，需求也非常高。

我推荐从 vllm 开始，简单搜索即可找到其 GitHub 资源库。vllm 是由伯克利开源的 LLM 推理框架，集成了丰富的功能，代码质量极高，生态活跃。可以尝试运行一些代码并部署自己的 LLM，逐步理解如何优化 LLM，包括 kv cache、page attention 的使用，注意力机制的工作原理，pre-fill 和 decode 的过程，以及 autoregressive 生成的各种采样方法，如 topK 和 temperature。

如果你想更深入地了解，还可以探索 Ray 的多卡并行、Triton 等工具。总的来说，我从 vllm 学到了很多。如果你对这个框架非常熟悉，甚至能够提出 PR（例如增加新模型），这将帮助你顺利通过一些简历筛选！

此外，sglang 是另一个类似的项目，运行速度更快，且许多模块复用了 vllm。之后，你可以尝试实际部署自己的 LLM，搭建一个小型服务。如果对模型本身感兴趣，深入学习注意力机制、位置嵌入等各个部分也是很有意义的，因为都有相应的代码和论文可供参考。