聊聊AI:行业现状与未来

在这瞬息万变的时代,关于人工智能(AI)的讨论从未消减。最近,有人向我提问:“哪个模型好?”我相信,下一版本肯定会更好。这一行业正经历着快速更新换代,架构复杂度与数据质量都在不断提升。

模型与基准

说到benchmark,我建议各位自己寻找参数。虽然不想阅读那些冗长的论文,但至少可以去查看一下 Hugging Face 上的model card。学术标准固然重要,但真正的体验还是在于使用,谁用谁知道。

AI行业的竞争

我常听到有关“AI卷”或“AI泡沫”的讨论。今天我想明确告诉你的是,AI确实在卷,但并不存在泡沫。卷的含义是什么呢?就是过度竞争。

一方面,人才数量激增。早期的AI,或许一个公司只需要一两位机器学习专家,几位数据处理人员就可以开展工作。但如今,大型公司往往员工数以百计,学历层次也越来越高,研究团队几乎全是博士。各个细分专业不断涌现,如数据、训练、运营、基础设施等,每一个团队都需要大量人力。门槛与日俱增,如果你经验不足,想要切入这一领域,可能已经错过了最佳时机。

对于非专业人士,或许从ops方向还有一些机会可以切入,之前我也提到过这一点。

模型的规模与挑战

此外,当前热门模型的规模正在急剧扩大,从最初的M级别,发展到如今的B甚至T级别。模型参数的故事不多聊,毕竟科普文章很少有人愿意细读。模型越大,训练与数据准备越是艰辛,数据的收集犹如一场苦差事,很多人在努力寻找数据时,最后却发现评估没有提升。

尽管synthetic data是一个不错的选择,但也很容易让自己陷入自欺欺人的境地。再说到标注(labeling),这也是一项耗时耗力的工作。

AI的多重工作流

AI是一个多重workflow的复杂运作,越来越强调运营效能。这个产业的细化趋势愈发明显。

计算资源与市场回报

计算资源方面也存在许多变数。大模型的训练成本不菲,特别是在基础模型的预训练阶段,几百到上千个节点,往往需要持续一个月的时间。大部分公司在后续训练中基于基础模型,尽管数据与计算量较少,但许多项目仍然缺乏充分的市场研究和测试,投入大量资源的同时,实际回报却无法确认。

关于芯片的事情就不多说,免得惹麻烦。今天我想先聊的就是这些,关于泡沫的事情下次再谈。就这样,拜~

总结

在这个AI急剧发展的时代,行业的竞争日益加剧,无论是在人才、模型还是市场应用方面,都提出了新的挑战。希望每位从业者都能在这个复杂的环境中找到自己的出路与机遇。

💡 标签:#ai #人工智能 #google #谷歌 #gpt #meta #llama #nvidia #转行 #找工作啊找工作

趋势