OpenAI和Mistral AI所倡导的机器学习方法极为耗费算力,背后的理念是人工智能模型在生成新见解前,必须先过完整个数据集。
泽普·赫克赖特(Sepp Hochreiter)持有不同观点,他的方法所需的资金和算力少得多。赫克赖特是AI技术领域的早期先驱,在奥地利林茨的约翰内斯·开普勒大学运营着一个人工智能实验室。他致力于教会人工智能模型如何高效地遗忘。
赫克赖特在人工智能领域享有特殊地位,多数计算机科学家尚未涉足AI之际,他已攀登至该技术的巅峰。上世纪90年代,在慕尼黑大学就读期间,他提出了影响深远的理论框架,成为了Alphabet、苹果和亚马逊等公司采用的第一代轻捷AI模型的基石。
这种方法被称为长短期记忆网络(LSTM),不仅能让计算机记住复杂数据,还能判断哪些信息可以舍弃。麻省理工学院出版社(MIT Press)发表赫克赖特的研究成果后,他在科技圈声名大噪,LSTM也成为了行业标准。
如今,随着人们对人工智能巨大能耗的担忧加剧,加之欧洲在AI发展上起步缓慢,这位58岁的科学家重返舞台,基于上述方法,推出了新的人工智能模型。
去年5月,他和研究团队发布了xLSTM,据他所说,这一模型比生成式人工智能速度更快、能效更高。为解释其工作原理,他提到了一种更为古老的信息技术:书籍。
读者每次拿起小说,开始阅读新的章节时,并不用重温前面的每个字,就能知道故事进展。读者会记住情节、次要情节、人物和主题,并自动忽略不重要的信息。赫克赖特认为,区分该记和能忘的内容,是实现快速高效计算的关键。
正因如此,xLSTM无需依赖耗资巨大的数据中心来存储和处理海量数据。用他的话说,“这是个更轻便、更快的模型,能耗远低于现有方案”。
长期以来,这一行业被美国科技巨头主导。但今年早些时候,中国的DeepSeek取得成功,显示出注重效率的AI方案越来越受投资者青睐。DeepSeek起步资金仅1000万元人民币(约140万美元)。现在,其他AI企业也开始采用所需芯片更少的模型,甚至在此之前,就有人推动研发更轻捷、成本更低的小型语言模型。
美欧贸易战一触即发,技术主权需求凸显,赫克赖特认为量身定制的AI方案很适合欧洲。他说:“未来几年,大家都会转向更有针对性的新模型,对欧洲来说,整合我们掌握的技术、算法和方法很重要。”
赫克赖特的人工智能研究所位于德国东部,距离他成长的农场约150公里,他在那里接受采访时解释称,相较于大型语言数据集,利用私营制造业和贸易数据更有价值。“语言并非大多数公司的核心业务。”他说。
然而,并非所有人都表示信服。赫克赖特仍需证明他的技术能实现规模化应用。研究过其策略的计算机科学家指出,他训练的模型比ChatGPT小得多。有人质疑xLSTM能否实现规模化,以及处理更大规模的数据集时,还能否保持设想的高效计算优势。
这些疑问,或许能在赫克赖特及其团队进军企业界的过程中找到答案。
过去一年,他的实验室孵化了两家公司,目前正与欧洲的机器人、无人机和电网设备制造商合作。第一家公司NXAI GmbHi由赫克赖特担任首席科学家,已筹集约2000万欧元(2200万美元),由奥地利实业家斯特凡·皮勒(Stefan Pierer)领投。第二家公司Emmi AI GmbH由前微软研究员约翰内斯·布兰德施泰特(Johannes Brandstetter)运营,3月开始商业运营。
NXAI目前并不寻求风险投资,而是吸引企业入股针对汽车、生物技术和机器人等行业定制的垂直AI模型。“目前,人工智能存在投资回报率问题,”NXAI首席执行官阿尔贝·奥尔蒂格(Albert Ortig)说,“我们希望打造具有长期价值的企业,而不是几年后就以10亿欧元的价格被卖掉。”
在多瑙河畔的实验室里,赫克赖特坚信自己走在正确的道路上。“我们创造出了更好的产品。”他说。编辑/陈佳靖
网友留言(0)