大模型你方唱罢我登场，到底谁在裸泳？

作者：蓝逸日期：2023-10-23 浏览：93℃ 分类：分享

转载摘要

本文以应用生成为场景，设计了一系列 testcase ，主要考查模型的推理能力及指令遵从的能力，测评了当前主流的国内外大模型。以下为关键结论：

没想到百度表现这么差……

内容版权声明：除非注明，否则皆为本站原创文章。

转载注明出处：http://dixi.eu.org/27369.html

上一篇时隔两年多了，有人还记得 vivo 快应用的那个"后门"么？

下一篇兄弟们，谁有身份证号前六位籍贯对照表？不是行政区划代码对照表