李开复零一万物公司回应大模型争议:承认模型结构基于GPT结构

李开复零一万物公司回应大模型争议:承认模型结构基于GPT结构

来源:欧宝官网app客户端下载    发布时间:2023-12-24 17:13:42

」的大模型 Yi-34B 引发争议,因研究者发现其基本采用 LLaMA 架构,但只是对两个张量进行了重命名。 2. 有关该模型的性能和成就,包括上下文窗口大小超过200k、一次处理40万

产品详细

  」的大模型 Yi-34B 引发争议,因研究者发现其基本采用 LLaMA 架构,但只是对两个张量进行了重命名。

  2. 有关该模型的性能和成就,包括上下文窗口大小超过200k、一次处理40万汉字、在 Hugging Face 全球开源模型排行榜中获得双料冠军等。

  3. 在社区中有人指出,Yi-34B 其实就是对 LLaMA 代码的一次重构,但未作实质性改变,引起对虚假宣传、许可证违规等问题的疑虑。公司回应表示基于 GPT 结构,并在模型训练中遇到的一些需求导致了代码重命名。

  站长之家(11月15日 消息:最近,「零一万物」公司旗下的大模型 Yi-34B 因使用 LLaMA 架构但改变张量名引发争议。这一争议中,研究者指出其代码其实就是对 LLaMA 代码的一次重构,只是未作实质性改变。社区担心这可能违反了许可证规定,且未经过框架支持的外部代码附加可能存在安全风险。

  Yi-34B 的成就在开源大模型领域引起了广泛关注,其上下文窗口大小超过200k,能处理40万汉字,成为全世界开源模型双料冠军。然而,争议的核心在于其是否真正符合 LLaMA 的许可协议,以及对模型代码的更改是否属于虚假宣传。

  在社区的讨论中,有人提到模型的性能参数和配置存在疑虑,包括模型被标榜为32K 模型实际上配置为4K 模型的问题。此外,对于模型的微调数据和基准测试的信息也没有充分提供,引起了社区的疑虑。

  「零一万物」公司回应称,他们的模型结构基于 GPT 成熟结构,但在训练实验中由于需求对代码进行了更名。他们强调模型的结构只是其中一部分,投入了大量研发工作在数据工程、训练方法、评估方法等方面,这是他们在大模型预训练阶段的核心技术护城河。最后,他们表示尊重社区的反馈,将代码进行更新以更好地融入 Transformer 生态。

  综合来看,争议集中在「零一万物」公司的 Yi-34B 模型是否违反了开源协议,以及其在性能参数和代码修改上的透明度。这一事件提醒开源社区对于模型的合规性和透明度的重要性,同时也反映了在开源领域中公司的技术选择可能引发广泛关注和争议的现实。

  11.11云上盛惠!海量产品 · 轻松上云!云服务器首年1.8折起,买1年送3个月!超值优惠,稳定性很高,让您的云端之旅更加畅享。快来腾讯云选购吧!

  11月24日,零一万物基正式对外发布并开源微调模型Yi-34B-Chat,可申请免费商用。零一万物还为开发者提供了4bit/8bit量化版模型,Yi-34B-Chat4bit量化版模型可以直接在消费级显卡上使用。Yi系列模型已在ModelScope社区开源,开发的人能在社区中下载、推理和训练这些模型。

  仅次于GPT-4,李开复零一万物Yi-34B-Chat最新成绩公布——在Alpaca经认证的模型类别中,以94.08%的胜率,超越LLaMA2Chat70B、Claude2、ChatGPT!不仅如此,在加州大学伯克利分校主导的LMSYSORG排行榜中,Yi-34B-Chat也以1102的Elo评分,晋升最新开源SOTA开源模型之列,性能表现追平GPT-3.5。在五花八门的大模型评测中,伯克利LMSYSORG排行榜采用了一个最为接近用户体感的“聊天机器人竞技场”特殊测评模式,让众多大语言模型在评测平台随机进行一对一battle,通过众筹真实用户来进行线上实时盲测和匿名投票,11月份经25000的线个大模型的总得分。”现在,Eric慢慢的变成了Yi-34B的忠实拥趸,会使用Yi-34b-200k数据集训练其他的模型产品,并感叹丝滑般的训练体验。

  李开复的Yi-34B-Chat模型在多个评测中大放异彩。其94.08%的胜率超越了LLaMA2和ChatGPT等主流大模型,尤其在加州大学伯克利分校主导的LMSYSORG排行榜中,以1102的Elo评分追平了GPT-3.5。这一系列的成绩和问题共同勾勒出Yi-34B-Chat模型的成功轨迹,尽管受到一些质疑,但其在技术创新和用户体验方面的表现仍然备受瞩目。

  华中科技大学官方发文称,该校软件学院一团队发布了多模态大模型Monkey”。该模型擅长图像描述和视觉问答,可以在一定程度上完成对世界的观察”,对图片进行深入问答交流和精确描述。值得一提的是,该团队已将Monkey代码在全球最大的代码托管服务平台GitHub上开源。

  今天在朋友圈看到一张图:国内的“百模大战”已升级成“两百模大战”,据不完全统计,今年1-7月国内共发布了64个大模型,截至目前叫得出名字的国产大模型已接近200家。这么多大模型,哪些是真能打的?在每天冒出来的各类“榜单”上出现了“家家第一”的情况,甚至已不止一款国产大模型“碾压”了GPT-4,且很多“世界顶级”大模型是出自刚成立的团队之手。有没有B端客

  汉字序顺并不定一影阅响读。日本东京大学的一项实验发现,这个“定理”居然也适合GPT-4。他还把这段内容放进了OpenA官方的tokenizer工具,发现GPT-4看到的token其实是这样的:这里面除了“UNDER”、“SEA”和“OF”之外,几乎剩下的所有token都看起来“毫无逻辑”,这更加使人费解了。

  在理想汽车智能软件发布会上,理想带来了MindGPT,这是理想全自研的多模态认知大模型,目前还处于内测版本。MindGPT是行业唯一不需要任何指令词就能够正常的使用的大模型,也是行业唯一真正围绕车载场景打造的大模型。理想汽车全国405家零售中心的展车及试驾车已全部全面升级至OTA5.0内测版,迎接用户到店体验。

  给你一首曲子的音频和一件乐器的3D模型,然后问你这件乐器能否演奏出这首曲子。你能够最终靠听觉来辨认这首曲子的音色,看它是钢琴曲还是小提琴曲又或是来自吉他;同时用视觉识别那是件什么乐器。用等价的线性投影模块替换其中一个Q-Former后,图像-3D的性能会下降一半以上,音频-视频的性能会下降超过10个点。

  “取消今晚所有计划!”,许多AI开发者决定不睡了。只因首个开源MoE大模型刚刚由MistralAI发布。最新的梗图:磁力链接就是新的arXiv。

  在12月22日的全国信息技术标准化技术委员会人工智能分委会全员会议上,腾讯混元大模型率先通过国家大模型标准符合性测试。本次评测由中国电子技术标准化研究院发起,基于32个细分维度,对国内主要的大模型来测试。腾讯云还以提案牵头方身份启动《人工智能模型即服务功能要求》的讨论与编制,推动MaaS领域标准化。

  如果您需要一个快速准确的AI检测工具,您来对地方了。我们的AI内容检测器可以准确地显示出文本中是否有任何部分是由AI生成的。使用它并自行检查!

  Reference Finder是一个帮助学生快速找到可靠引用来源的工具。它能够给大家提供一系列与您的论文主题相关的可靠来源,帮助您快速完成论文。使用我们的引用查找工具,轻松快捷地撰写论文。

  Fast HW是一款AI写作助手,帮助你轻松引用科学文献并组织你的文章。它可提供写作建议、自动引用文献、优化语言表达等功能,让你的写作更加高效和专业。定价灵活多样,适用于大学生和专业写作人士。

  CoGrader 是一款教师评分助手,通过 AI 技术帮助教师高效评分,提供即时和全面的反馈,节省 80% 的评分时间。支持 Google Classroom 集成,可以导入和导出作业。通过一系列分析学生数据,提供班级分析和挑战点,支持多语言评分。

  Rex.fit是一个由AI驱动的营养和健身教练,旨在根据自己的独特目标(如长寿、减肥或增肌)量身定做健康转型方案。通过WhatsApp与Rex交流,用户都能够记录餐食、获取个性化的锻炼建议、查看日常报告和反馈,从而在减重、健身或提高生活品质方面取得显著进展。

  Aha Vector Search是一个高性能、低成本的端到端向量搜索服务。它提供了一种快速构建端到端向量搜索的方法,帮助用户以更低的成本实现高效的搜索体验。

  SparkSocial是一款AI驱动的社会化媒体营销工具,通过监控关键词、实时追踪、情感分析和全面报告,帮助用户更接近受众。它提供自动生成回复、竞争分析、受众发现等功能,帮助用户发现潜在客户、提升品牌曝光、进行大规模冷外联等,同时提供数据驱动的报告和分析。定价灵活,适用于企业、代理机构、SaaS以及创作者。

  News Minimalist是一个AI策展的新闻摘要服务,它从海量新闻中筛选出线%的故事。这个服务提供了一个没有垃圾新闻、点击诱饵或广告的纯净新闻阅读体验,用户都能够通过每日通讯获得新闻摘要。

  Creately VIZ是一款AI视觉智能工具,能够快速生成可视化内容,自动化任务,并帮助用户发现新的视角。它提供多种功能,包括AI模板生成、自动化工作流程、与团队协作等。适用于各种场景,如白板协作、业务流程管理、战略规划等。产品定位于提高团队工作效率,提供创新视角。

  GeminiProChat是GeminiPro的最小化Web界面,提供简洁有效的聊天体验。它支持通过环境变量来控制网站,允许使用者通过Docker部署,并提供易于部署的Vercel和Railway选项。GeminiProChat是一个灵活的工具,适用于需要简单、高效聊天界面的用户。

  AppAgent是一个基于LLM(大型语言模型)的多模态代理框架,设计用于操作智能手机应用。通过简化的动作空间(如点击和滑动),模仿人类般的互动方式,实现应用操作,无需系统后端访问。代理通过自主探索或观察人类演示学习新应用的使用方法,创建知识库用于执行不同应用中的复杂任务。

  Reply Boy是一款Chrome浏览器插件,旨在帮助您增加Twitter账号的曝光。您可以选择不同类型的回复(问题、肯定),并选择不同的情绪(浪漫、有趣、聪明等),从而轻松产生优质的推文。Reply Boy注重安全和隐私,不追踪用户数据,不记录消息,遵守Twitter规则,无需您的密码。您可以免费尝试,无需任何设置。

  DeepSwapper是一款免费高质量的换脸服务。用户能够最终靠上传图片进行换脸操作,DeepSwapper提供无水印、无广告、高质量、无限次数的换脸服务。DeepSwapper使用AI技术实现真实的脸部交换效果。DeepSwapper支持多种图片格式上传,同时也提供API服务。

  Animos是一款面向儿童的对话玩具,也是家长的辅助工具。它通过AI技术回答孩子的各种问题,提供逻辑思维游戏,引入早期双语环境,并帮助孩子理解和处理情感。Animos旨在将屏幕时间转化为互动学习冒险,提高儿童的语言发展,识别孩子的兴趣并激发好奇心。此外,Animos注重隐私保护和内容安全,为家长提供日常总结和反馈功能。

  使用Resume,在短短 5 分钟内创建一份能帮助你获得工作的简历。选择超过 20 个专业、现代和创意的简历模板。

  Slay School是一款AI闪卡制作器,能够帮助学生将笔记转化为简洁易记的闪卡,节省时间并专注于学习。用户都能够上传讲座资料、粘贴笔记或提交链接,Slay School能在几秒钟内自动生成闪卡。支持自测或导出至Anki/Quizlet。产品定位于学生群体,特别适合医学生。

  Steerable Motion是一个用于批量创意插值的ComfyUI节点。我们的目标是展示在图像作为视频模型演变时,如何以最佳方式驱动运动。

  EasyTranslator是一个基于OpenAI API的命令行工具,支持多种文件格式(包括.txt、.pdf、.docx、.md、.mobi和.epub)的翻译。它可以轻松地翻译文本文件,消除语言障碍。

  Google Gemini是由DeepMind开发的多模态AI模型,可以处理文本、音频、图像等多种信息。它包括三个版本:Ultra、Pro和Nano,分别针对不同的任务复杂度。Gemini在AI基准测试中表现出色,针对各种设备进行了优化,并已经过安全和偏见测试,遵循负责任的AI实践。它将集成到Google产品中,并通过Google AI Studio和Google Cloud Vertex AI提供。

  Voxio是一款语音转换为Notion页面的应用。它提供了多种布局和文本块,用户都能够自由选择。用户可以在Voxio应用程序中或后台捕捉他们的语音,并通过单个滑动将其发送到Notion。此外,用户都能够随时保存录音并在稍后发送。Voxio支持多语言,适用于全球用户。


上一篇: 蓝深集团股份正在参加2020年度“潜水搅拌机十大品牌” 评选活动

下一篇: 潜水设备及练习改变