专栏/2024 AIGC每日新闻|3月5日-Claude 3发布,性能超越GPT-4

2024 AIGC每日新闻|3月5日-Claude 3发布,性能超越GPT-4

2024年03月05日 15:51--浏览 · --点赞 · --评论
粉丝:8.5万文章:306
科技猎手


read-normal-img

🦈【AIGC每日新闻
  • 【Anthropic发布多模态AI聊天机器人Claude 3,性能超越GPT-4】Anthropic,一家得到谷歌支持的人工智能公司,推出了其迄今为止最先进和强大的聊天机器人Claude 3。这一代新的AI模型,包括Claude 3 Haiku、Sonnet和Opus三种,相较于前代在理解上下文和处理更长指令方面都有提升。Claude 3还是多模态的,能够解读文本和图片输入。Anthropic公司开发的新AI模型(Claude 3系列)在设计时考虑了提高对各种问题的响应能力,包括那些在早期版本中可能会被拒绝的问题。在早期版本的AI模型中,可能存在对某些看似无害的问题作出错误拒绝的情况,这表明了模型在理解和处理这些提示方面的局限性。新模型通过改进算法和训练数据,减少了这种错误拒绝的情况,从而能够更准确地理解和回答用户的问题,无论问题的复杂性如何。特别是最大的模型Opus,在执行高级推理任务时的表现非常出色。这些任务可能包括复杂的逻辑推理、理解复杂概念、解决难题等,这些任务的难度水平相当于研究生级别的学术挑战。在这些测试中,Opus模型的得分超过了OpenAI公司开发的GPT-4模型。Anthropic使用内部和第三方数据集的组合来训练这些模型,并得到了亚马逊AWS和谷歌云的支持,这两家公司都是Anthropic的投资者。这些模型将在AWS的Bedrock和谷歌的Vertex AI平台上提供。体验网址:https://claude.ai/chats

read-normal-img


  • 【Groq收购Definitive Intelligence,增强AI云平台】AI芯片初创公司Groq宣布收购Definitive Intelligence,以扩大其云平台的规模。这次收购旨在通过整合Definitive Intelligence的技术和服务,提升Groq在AI领域的竞争力。Groq专注于开发高性能AI处理器,而Definitive Intelligence则提供云基础设施和数据管理解决方案。结合双方的专长,Groq期望能够为客户提供更强大的AI计算能力和更高效的数据处理服务。参考文章链接:https://siliconangle.com/2024/03/01/ai-chip-startup-groq-acquires-definitive-intelligence-scale-cloud-platform


  • 【布林承认谷歌Gemini模型存在缺陷】谷歌联合创始人谢尔盖·布林(Sergey Brin)在加州希尔斯伯勒的“AGI之家”活动中公开承认,谷歌在推出Gemini图像生成模型时“肯定犯了错误”。布林表示,这一失误主要是由于测试不够彻底,导致了用户发现存在历史信息的不准确和有问题的回答。布林还提到,尽管AI模型有时会产生奇怪的回答,但谷歌正在努力减少这种“幻觉”现象。参考文章链接:https://www.cnbc.com/2024/03/04/sergey-brin-says-google-definitely-messed-up-with-gemini-launch-.html


  • 【前Twitter高管起诉马斯克,索要1280万美元遣散费】前Twitter高管(包括前CEO Parag Agrawal、前CFO Ned Segal、前法律主管Vijaya Gadde和前总法律顾问Sean Edgett)正在起诉埃隆·马斯克和现在的X公司,要求支付1280万美元的未付遣散费。他们声称,在马斯克以440亿美元收购Twitter后,他个人对这些高管进行了报复,并试图通过拒绝履行其他明确的合同承诺,来回收部分费用。这起诉讼是紧随X公司与前Twitter经理和工程师之间就未付5亿美元遣散费的和解谈判破裂之后,在加利福尼亚北区提起的。马斯克和X公司尚未对此诉讼作出回应。参考文章链接:https://www.theverge.com/2024/3/4/24090000/elon-musk-twitter-x-lawsuit-parag-agrawal-severance


  • 【微软研究院推出70倍能效提升的1-bit语言模型】微软研究院发表了一篇名为《1-bit大型语言模型时代》的论文,介绍了一种名为BitNet b1.58的新型1-bit大型语言模型。它通过使用三元组参数(-1, 0, 1)来显著降低模型的延迟、内存、吞吐量和能耗,同时保持与全精度(FP16)模型相当的性能。BitNet b1.58在能效上提高了70倍,体积比LLaMA LLM小4倍,这对于在保持性能的同时扩大AI系统的部署并显著提高能效具有重要意义。论文地址:https://arxiv.org/pdf/2402.17764.pdf


🦭【今日份Prompt技巧
Implement example-driven prompting (Use few-shot prompting).实施基于示例的引导提示(使用少量样本引导)。例如,给AI看几张猫和狗的图片,然后问它:“这张新图片是猫还是狗?” AI会根据之前看过的猫和狗的图片来判断。(技巧来源于:https://arxiv.org/pdf/2312.16171.pdf)


投诉或建议