近日,AI领域迎来了一项重大突破,由MiniMax公司发布的MiniMax-01系列大模型,凭借其创新的线性Attention机制架构,在全球范围内引起了广泛关注。这款大模型不仅在参数规模上突破了4000亿大关,更是在处理上下文长度上达到了惊人的400万token,成为目前全球最长的AI大模型之一。
这一成果的背后,隐藏着一个与游戏行业紧密相关的故事。MiniMax-01系列所依赖的线性Attention机制架构,其核心理论源自于心动TapTap增长和商业化部门(IEM)下的AI团队算法研究员秦臻。秦臻的研究工作不仅在大规模商用级别上验证了这一技术的可行性,更使得MiniMax-01系列的成本比GPT-4低了10倍,因此被海外媒体誉为“来自中国的AI变革”。
然而,令人惊讶的是,秦臻并非来自传统的AI创业公司,而是在一家游戏公司的AI团队中工作。据透露,心动TapTap在AI领域的探索起步较早,尽管没有明确的“主线任务”,但公司始终秉持长期主义的态度,鼓励团队进行探索性尝试。这种宽松自由的氛围,正是秦臻选择加入TapTap的重要原因之一。
秦臻的研究之路并非一帆风顺。在加入TapTap之前,他曾向多家大厂投递过简历,但最终选择了与TapTap双向奔赴。在TapTap,尽管算力资源无法与大厂相比,但公司仍然全力支持秦臻的研究工作。秦臻表示,正是这种宽松的环境和长期的坚持,使得他能够在线性Attention领域取得突破性进展。
MiniMax-01系列的成功发布,不仅验证了秦臻的研究成果,也为AI领域的发展注入了新的活力。MiniMax公司敢于在大模型浪潮中走出一条不同的道路,其前瞻性和勇气令人敬佩。同时,秦臻的故事也告诉我们,只要有耐心、有包容的环境和长期主义的坚持,有价值的事情最终一定会被看到。
在接受采访时,秦臻表示:“如果你做的事真的很有价值,最后一定会有它被用上的一天。”这种对价值的坚定信念,正是他能够在AI领域取得突破的重要原因。而心动TapTap对AI探索的支持,也为秦臻提供了宝贵的成长土壤。
展望未来,心动TapTap和秦臻的团队将继续在AI领域进行探索,尝试更多多模态大模型的应用,以支撑TapTap的业务发展。同时,他们也希望能够在AI技术的浪潮中保持韧性,接受失败,最终在某个时间节点上取得更大的突破。