记一次我对多个 LLM 进行的医学小测试

背景: 最近在 B 站看到有作者对多个 LLM 进行医学难题的测试,但视频看起来有点像商单,于是萌生了个想法把手头的 AI 都测试一下,看 AI 给 AI 打分,还挺有趣的。于是分享给大家看看。 流程: 首先使用 ChatGPT 5.2 Pro(标准 effort) 生成一道内科医学难题。 然后让以下 AI 进行解答,然后把所有回答再给 ChatGPT 5.2 Pro(标准 effort)进行评分。评分一次后,再让它核对一遍评分。 被测选手: 模型 设置 链接 Gemini 3.1 Pro Preview 绑定 Key 、开启 Code Execution 、开启 Grounding With...

Taalas 推出首款专用 ASIC 加速卡 声称实现亚毫秒级推理

多伦多——2026 年 2 月 19 日,专注于人工智能专用集成电路( ASIC )的初创公司 Taalas 宣布,其首款商用产品——基于自研 HC1 平台、硬件实现的 Llama 3.1 8B 模型加速卡已正式面世。公司在当天的新闻稿( https://taalas.com/the-path-to-ubiquitous-ai/)中称,该加速卡的推理吞吐速率约为每秒 1.7 万 token ,成本和功耗分别比同类 GPU 方案低约 20 倍和 10 倍。 Taalas 的宣传材料列出三项核心设计理念: 全专用化——为每个 AI 模型单独定制硅片,以期在算力和能耗上实现更高效率。 存算合一——将...

现在的主旋律洗脑作用真大。

大年初三晚上,在 youtube 上看有个 UP 在总结 2025 十大烂片,其中讲到 731 的时候,9 岁的儿子跑过来看了一会,突然说: 爸,我想手搓个核弹送个日本。大为震撼。...

Gemini 新增音乐生成功能

如题所示,但是目前只支持最长 30s 的音频,样品如下: https://drive.google.com/file/d/1NcDpezLGmXiDuD2MMe7XdH5pBeQqrLlP/view?usp=sharing 感觉还行...