【大模型日报丨6.13】马斯克悄然撤诉OpenAI!
奇绩创坛小助手
2024年06月13日 23:26
AI研究所
cut-off

这里是LLM SPACE,每日分享最新最全的AI资讯与研究。希望通过传播内容吸引更多对AI感兴趣的朋友,共建华人AI生态!

如果你有大模型相关的创业想法,或者对AI有一些有趣的想法,欢迎来找我们聊聊!

cut-off

01

马斯克悄然撤诉OpenAI!xAI融资招聘顺利,战略拖延已达成?

最新消息,马斯克主动撤销了对OpenAI提起的诉讼。就是之前指控奥特曼和OpenAI公然违背了创始协议转向盈利,要求OpenAI恢复开源那个事。事件已过去近四个月,如今法院文件显示,此案是无罪开释。原本就在今天,旧金山还有一场听证会,法官将考虑被告请求,决定是否应当驳回此案。值得一提的是,3月份有专家告诉CNBC,案件的核心合同并非由所有涉事方签署的正式书面协议,也就是说一开始该案的法律基础就有问题。

02

谷歌工程师批评 OpenAI,称其延缓 AGI 研究进展

谷歌软件工程师弗朗索瓦・肖莱(François Chollet)在播客与主持人 Dwarkesh Patel 对话时,表达了他对 AGI(通用人工智能,Artificial General Intelligence)研究现状的担忧。肖莱表示,几年前所有最先进的研究成果都是公开分享和发表的,但现在情况已经不再如此。他将这一变化归因于 OpenAI 的影响,指责他们导致了“前沿研究出版的完全关闭”(complete closing down of frontier research publishing)。

03

全华人团队推出多模态大模型新基准,GPT-4o准确率仅为65.5%,所有模型最易犯感知错误

GPT-4o再次掀起多模态大模型的浪潮。如果他们能以近似人类的熟练程度,在不同领域执行广泛的任务,这对许多领域带来革命性进展。因而,构建一个全面的评估基准测试就显得格外重要。然而评估大型视觉语言模型能力的进程显著落后于它们自身的发展。来自上海AI Lab、香港大学、上海交大、浙江大学等多家机构提出了 MMT-Bench。

04

手机流畅运行470亿大模型:上交大发布LLM手机推理框架PowerInfer-2,提速29倍

苹果一出手,在手机等移动设备上部署大模型不可避免地成为行业关注焦点。然而,目前在移动设备上运行的模型相对较小(苹果的是3B,谷歌的是2B),并且消耗大量内存,这在很大程度上限制了其应用场景。即使是苹果,目前也需要与OpenAI合作,通过将云端GPT-4o大模型嵌入到操作系统中来提供能力更强的服务。这样一来,苹果的混合方案引起了非常多关于数据隐私的讨论和争议,甚至马斯克都下场讨论。既然终端侧本地部署大模型的方案既让手机用户享受到AI强大的智能,又能保护好自己的隐私安全,为什么苹果还要冒着侵犯隐私的风险选择联手OpenAI采用云端大模型呢?主要挑战有两点:

  • 手机内存不够大:按照大模型的Scaling Law法则,模型参数越大,能力对应的也就越强,这就意味着能力更强的模型对内存的要求越高。

  • 手机算力不够强:即使勉强把通过量化等手段把模型塞进手机了,推理速度也慢,适合的应用场景也就非常有限了。

为了解决上述挑战,上海交大IPADS实验室推出了面向手机的大模型推理引擎(目前论文已在arxiv公开):PowerInfer-2.0。

05

韩国两家AI芯片制造商寻求合并

韩国两家AI芯片制造商Sapeon Korea和Rebellions周三表示,为了在全球AI芯片市场站稳脚跟,将寻求合并。两公司计划寻求股东的批准,争取在9月底之前完成合并。据两公司的高管称,合并后的实体将于今年年底推出。

cut-off

外界噪声多,看这日报,足矣!

欢迎在下方反馈您宝贵的阅读意见!

欢迎您积极转发,让更多人看到LLM SPACE!