Hugging Face 是一个机器学习(ML)和数据科学平台及社区,可帮助用户构建、部署和训练机器学习模型。
它提供了在实时应用中演示、运行和部署人工智能(AI)的基础设施。用户还可以浏览其他人上传的模型和数据集。Hugging Face 经常被称为机器学习领域的 GitHub,因为它允许开发人员公开分享和测试他们的工作。
Hugging Face 因其 Transformers Python 库而闻名,该库简化了下载和训练 ML 模型的过程。该库为开发人员提供了一种有效的方法,将 Hugging Face 上托管的 ML 模型之一纳入其工作流程,并创建 ML 管道。
该平台的重要性在于其开源性质和部署工具。它允许用户共享资源、模型和研究,减少人工智能开发的模型训练时间、资源消耗和环境影响。
Hugging Face Inc. 是创建 Hugging Face 平台的美国公司。该公司由法国企业家克莱门特-德朗格(Clément Delangue)、朱利安-肖蒙(Julien Chaumond)和托马斯-沃尔夫(Thomas Wolf)于 2016 年在纽约创立。公司最初为青少年开发了一款同名聊天机器人应用。在将聊天机器人应用背后的模型开源后,该公司将重点转向机器学习平台。
2023 年,该公司宣布与亚马逊网络服务公司(Amazon Web Services)合作,向 AWS 客户提供 Hugging Face 产品,用于构建定制应用程序。截至目前,谷歌、亚马逊和 Nvidia 只是投资这家初创公司的几家公司。
如何使用 “Hugging Face”? Hugging Face 是一个人工智能平台和支持社区。社区利用 "Hugging Face "进行以下工作:
实施机器学习模型。用户可以向平台上传机器学习模型。这些模型适用于多种功能,包括自然语言处理(NLP)、计算机视觉、图像生成和音频。
分享和发现机器学习模型。通过 Spaces 和 Hugging Face Transformers 库,研究人员和开发人员可以与社区共享模型。其他用户可以下载这些模型,并在自己的应用程序中使用它们。
共享和发现数据集。研究人员和开发人员可以共享用于训练机器学习模型的数据集,也可以通过数据集库发现用于训练模型的数据集。
微调模型。用户可以使用 Hugging Face 的应用编程接口 (API) 工具微调和训练深度学习模型。
Host演示。Hugging Face允许用户在浏览器中创建机器学习模型的交互式演示。这让用户可以更轻松地展示和测试模型。
研究。Hugging Face 一直参与合作研究项目,如 BigScience 研究研讨会,旨在推动 NLP 领域的发展。该网站还开设了一个页面,提供经过整理的研究论文列表。
开发商业应用。Hugging Face 的企业中心(Enterprise Hub)可让企业用户在私人托管环境中使用转换器、数据集和开源库。
评估机器学习模型。Hugging Face 提供了一个用于评估机器学习模型和数据集的代码库。
Hugging Face的功能 在 Hugging Face Hub 中可以找到 Hugging Face 的一些主要功能,包括以下内容:
模型。Hugging Face 拥有一个庞大的模型库,用户可以根据类型对其进行筛选。截至本文撰写时,Hugging Face 上共有 30 多万个模型。Hugging Face 平台上还有一些顶级开源 ML 模型。
数据集。数据集有助于训练模型,以了解数据之间的模式和关系,而创建一个好的数据集可能很难。抱抱脸 "提供由社区上传的数据集,用户可以访问这些数据集。
空间。机器学习模型本身通常需要技术知识才能实现和使用。Spaces 将模型打包成用户友好的体验,让用户展示他们的工作。Hugging Face 提供托管演示所需的计算资源。使用 Spaces 不需要任何技术知识。
使用 "Hugging Face"的好处 Hugging Face 的开放源代码和社区性质带来了许多好处:
可访问性。Hugging Face 可帮助用户绕过人工智能开发中典型的计算和技能要求限制。Hugging Face 提供预训练模型、微调脚本和用于部署的应用程序接口,这使得创建 LLM 的过程变得更容易。
集成。Hugging Face可帮助用户集成多个ML框架。例如,Transformer 库可与 PyTorch 和 TensorFlow 等其他 ML 框架集成。
原型设计。Hugging Face 可实现 NLP 和 ML 应用程序的快速原型开发和部署。
社区。Hugging Face 提供了访问庞大社区、持续更新模型以及文档和教程的途径。
经济高效。Hugging Face 为企业提供经济高效、可扩展的解决方案。从头开始构建大型 ML 模型可能非常昂贵,而使用 Hugging Face 的托管模型可以节省资金。
挑战和考虑因素
在权衡 Huggingface 的益处时,还需要考虑一些因素和风险,包括以下几点:
偏差。与任何预训练的机器学习模型一样,Hugging Face 上提供的模型容易受到偏见的影响,这可能会导致模型生成性别歧视、种族主义或仇视同性恋的内容。
计算要求。Hugging Face 上有一些较大的模型需要比平台默认提供的计算量更多的计算,用户需要购买。例如,Bloom 是一个大型多语言语言模型,运行成本可能很高。
支持。该平台的免费版和专业版没有专门的客户支持。
模型搜索。有时很难在平台上托管的众多模型中找到合适的模型或库。
安全性。使用 Hugging Face 的企业应确保平台提供的安全措施符合企业的数据安全需求。
Huggingface和更广泛的人工智能生态系统
与其他当代人工智能初创公司相比,Hugging Face 强化了一种更具协作性的人工智能开发方法,这些公司开发人工智能服务并向人们收取使用费,同时将技术的内部运作方式作为商业机密。
随着越来越多的公司寻求开发自己的人工智能模型,Hugging Face 将为开发者提供相关工具。俗话说得好淘金热,卖铲子。许多大公司已经与 Hugging Face 合作,利用其开发平台。
抱抱脸的目标是让更多人能够使用人工智能,而不是将其限制在少数关键参与者手中。生成式人工智能公司的一些员工认为,开源人工智能将超越 OpenAI 和谷歌等闭源人工智能提供商。2023 年初,谷歌研究人员泄露的一份通信表达了该研究人员的观点,即谷歌在该行业 “没有护城河”:“在我们争吵不休的时候,第三派已经悄悄地吃起了我们的午餐”。