记一次我对多个 LLM 进行的医学小测试

背景: 最近在 B 站看到有作者对多个 LLM 进行医学难题的测试,但视频看起来有点像商单,于是萌生了个想法把手头的 AI 都测试一下,看 AI 给 AI 打分,还挺有趣的。于是分享给大家看看。 流程: 首先使用 ChatGPT 5.2 Pro(标准 effort) 生成一道内科医学难题。 然后让以下 AI 进行解答,然后把所有回答再给 ChatGPT 5.2 Pro(标准 effort)进行评分。评分一次后,再让它核对一遍评分。 被测选手: 模型 设置 链接 Gemini 3.1 Pro Preview 绑定 Key 、开启 Code Execution 、开启 Grounding With...

Taalas 推出首款专用 ASIC 加速卡 声称实现亚毫秒级推理

多伦多——2026 年 2 月 19 日,专注于人工智能专用集成电路( ASIC )的初创公司 Taalas 宣布,其首款商用产品——基于自研 HC1 平台、硬件实现的 Llama 3.1 8B 模型加速卡已正式面世。公司在当天的新闻稿( https://taalas.com/the-path-to-ubiquitous-ai/)中称,该加速卡的推理吞吐速率约为每秒 1.7 万 token ,成本和功耗分别比同类 GPU 方案低约 20 倍和 10 倍。 Taalas 的宣传材料列出三项核心设计理念: 全专用化——为每个 AI 模型单独定制硅片,以期在算力和能耗上实现更高效率。 存算合一——将...

现在的主旋律洗脑作用真大。

大年初三晚上,在 youtube 上看有个 UP 在总结 2025 十大烂片,其中讲到 731 的时候,9 岁的儿子跑过来看了一会,突然说: 爸,我想手搓个核弹送个日本。大为震撼。...

Gemini 新增音乐生成功能

如题所示,但是目前只支持最长 30s 的音频,样品如下: https://drive.google.com/file/d/1NcDpezLGmXiDuD2MMe7XdH5pBeQqrLlP/view?usp=sharing 感觉还行...

我之前上的网站都已经开始出单了,现在继续做新词新站,离哥飞教练说的走出新手村目标,我也慢慢快到啦。

出海日记 我之前上的网站都已经开始出单了,现在继续做新词新站,离哥飞教练说的走出新手村目标,我也慢慢快到啦。 因为看到,然后相信,然后去做,中间 11 个月没有任何反馈,但是拿到结果后,这种兴奋真的非常 nice 。 新站继续: https://lyria3.one...

内存硬盘涨疯了

ddr4 4g*2 2666Mhz 笔记本内存条 竟然 210 卖掉了,去年还扔掉了一根 4g 的笔记本条觉得以后都不会用到,也没什么用(当时 10 元购入的),当时闲鱼价格一根也才 20 元,现在涨了 5 倍。。。大概 24 年 10 月的时候 16g*2 3600MHz ddr4 黑爵内存条一套 二手价格也才 250 左右这是我飞牛小主机上的内存条,什么时候才有机会接回来啊...我估计至少到 27 年才会回落吧...

AstrBot 开源了,支持 QQ、企业微信等几十种平台

是个强大的一站式 Agentic 助手。支持 QQ 、企业微信等几十种平台。有近 800 个插件可以用。让每个聊天软件都拥有 AI Agent 。https://laosu.tech/2026/02/18/AstrBot%EF%BC%9A%E8%AE%A9%E6%AF%8F%E4%B8%AA%E8%81%8A%E5%A4%A9%E8%BD%AF%E4%BB%B6%E9%83%BD%E6%8B%A5%E6%9C%89AI%20Agent...