草莓项目的突破与创业方向的思考
最近得知OpenAI正在内部训练代号“草莓”的新模型,有两点值得注意:
1. 推理能力已达到或接近人类水平。
2. 与提示词工程无关,是在模型的设计和训练阶段引入特殊技巧实现的。
草莓项目的创新
目前,很多所谓的“做agent”的公司,通过一系列复杂的提示词工程,将AI的推理能力从“小学生”水平提高到“大学生”水平。这背后隐含的一个结论是:模型的推理能力不会有大幅提高,只能通过框架和提示词优化来提高。
然而,草莓项目绕过了这些复杂的工程,直接在训练阶段强化了推理能力,相当于降维打击,使得创业公司所做的优化显得有些可笑。这犯了奥特曼自己多次提到的错误:不要假设模型能力一成不变,然后试图改进它的一些缺点的应用。
创业方向的建议
重新思考AI应用的方向
不直接做agent,而是做被agent调用的工具:
1. 模型公司 vs 应用公司:让AI推理能力达到人类水平,是模型公司(如OpenAI)应该做的事情,应用公司不必企图实现这个目标。
2. 面向AI的工具开发:即便AI可以像人一样推理,它仍需要一系列办公软件才能完成复杂的工作。面向AI,而不是人类用户,重新设计和开发一些常见的工具类软件,作为工具被agent调用,仍然有很大的机会。
具体思路
1. 无UI工具:AI不需要键盘、鼠标和美观的UI,因此可以开发无UI的工具,简化交互方式,提高效率。
2. 功能重构:考虑到AI的特点,可能涉及到很多功能的重构。例如:
• 文本处理工具:优化文本分析、生成和编辑功能,使其更适合AI的调用。
• 数据处理工具:开发适用于AI的数据清洗、转换和分析工具。
• 自动化流程工具:设计适合AI的自动化工作流程工具,帮助AI更高效地完成任务。
总结
草莓项目的突破展示了在模型设计和训练阶段进行创新的巨大潜力,创业公司应该重新思考自己的方向。不直接做agent,而是开发可以被agent调用的工具,这是一个更加现实且有前景的方向。通过面向AI重新设计工具软件,可以在AI应用领域找到新的机会,充分发挥AI推理能力的优势。
#人工智能 #OpenAI #创业 #agent #草莓项目 #AI工具开发