

👾【AIGC每日新闻】
【Claude-3 Opus领先GPT-4登顶榜首】Claude-3 Opus已正式超越GPT-4,在human eval leaderboard上荣登第一!GPT-4不得不让出它的宝座,现在成为了第二名。参考博客链接:https://huggingface.co/spaces/lmsys/chatbot-arena-leaderboard
【科技巨头联手挑战Nvidia AI芯片市场主导地位】近日,Google、Intel、Qualcomm和Arm等科技巨头集结成立UXL基金会,共同挑战Nvidia在人工智能芯片市场上的控制力。UXL基金会的目标是构建一个开源软件套件,使人工智能代码能夠在任何硬件上运行,不受芯片架构的限制。为了确保这一软件在整个硬件领域中的广泛兼容性,该组织正在吸引更多的芯片制造商加入,并希望亚马逊和微软等云服务巨头参与进来。这个项目是在Intel的OneAPI开放标准的基础上发起的,OneAPI的目的是消除将开发人员锁定在Nvidia的CUDA平台上的各种要求。此举的重要性在于,Nvidia的人工智能芯片已成为业界默认标准,但其真正优势在于使开发者“锁定”的软件层。如果UXL基金会的行动取得成功,可能会打破Nvidia对人工智能生态系统的控制,为新的参与者和创新打开大门。参考博客链接:https://www.reuters.com/technology/behind-plot-break-nvidias-grip-ai-by-targeting-software-2024-03-25/
【最新研究关注压缩大型语言模型的可靠性】最新的研究关注了压缩大型语言模型(LLMs)的可靠性问题。虽然压缩技术在保持模型性能方面取得了显著进展,但其安全性和可靠性方面的潜在风险却被忽视。研究通过五种压缩技术对三种领先的LLMs进行了评估,发现压缩与可靠性之间存在复杂关系。例如,量化方法在保持效率和可靠性方面比剪枝方法更为有效。此外,适度的量化水平能够改善某些可靠性维度,如伦理和公平性,而极端的量化则会降低模型的可靠性。这项研究为在实践中同时实现高效率、高实用性和高可靠性的LLMs提供了实用建议。参考博客链接:https://arxiv.org/pdf/2403.15447.pdf
👻【今日份Prompt技巧】Break down complex tasks into a sequence of simpler prompts in an interactive conversation.在交互式对话中将复杂的任务分解为一系列更简单的提示。