商汤 + NTU 做了个不用 Vision Encoder 也不用 VAE 的多模态模型,结果还挺能打

博客: https://huggingface.co/blog/sensenova/neo-unify 叫 NEO-unify ,主要卖点是把多模态里最"理所当然"的两个组件都扔掉了: 1.不用 Vision Encoder ( CLIP/SigLIP 之类的) 2.不用 VAE 直接从原始像素出发,理解和生成两条路径都塞在一个叫 MoT ( Mixture-of-Transformer )的骨干里。文本用自回归交叉熵,图像生成用 pixel flow matching ,统一训练。 比较有意思的几个地方: 图像重建质量上,2B 的模型在 MS COCO 上跑出来 PSNR 31.56 / S...

E220P-400T22S LoRa Module In-depth Analysis: Cost-effective Solution for Industrial Wireless Communication

IntroductionAgainst the backdrop of rapid growth in the global wireless communication module market, QYResearch shows that the global wireless module market size reached US$6.972 billion in 2025, and is expected to exceed US$10.36 billion by 2032, with a CAGR of 5.9%. Among them, Sub-1GHz industrial...

虚拟机挂微信也会掉线

参考这个 t/1154274 ,我用 pve 跑虚拟机挂微信,第二天早上起来,比掉线,没想到微信也会检测虚拟机,看来只能在我的实体的小主机上挂微信测试一下是不是因为虚拟机的问题了...

有人在用电视看书吗

手里拿着蓝牙遥控器怎么舒服怎么躺用电视看书推荐个软件the.pdfviewer3翻页时支持使用遥控器上的上下键翻页可以推荐些相关软件吗比如支持 EPUB 、TXT 、MOBI 、AZW 、AZW3 、PDF 的阅读器...

写了一个(豆瓣电影页面)抓取/解析爱看机器人资源的 Tampermonkey 脚本

爱看机器人是一个在线看电影的网站,资源非常多,尤其经典电影资源,相对冷门的资源和新片也有不少。 而且因为大部分片源的码率和分辨率都被压缩的很低,因此资源的在线观看速度也还行。部分片源甚至有高清资源。 不过这个网站有几个问题: 几乎所有片源都被二次压入各种乱七八糟的菠菜 、du*场广告; 网站在暂停/播放和切换线路时加了弹窗广告(准确的说应该是在新窗口打开一个第三方广告网站),实测 AdBlock 等广告插件也不太容易屏蔽; 部分线路资源过期,但页面无提示,需要不断点击切换线路手动检测,但此时很容易触发第二点提到的广告; 因为最近在出差,酒店的网速只能勉强支持这种低清画质的在线观看(其实手机上观...

发现一个 AI 账号注册与管理的一站式工具集开源项目,大家折腾起来!

最近看到一个整理得比较全的开源项目 AI-Account-Toolkit 分享给大家, 这个项目是 AI 账号注册与管理的一站式工具集。它把 ChatGPT 、Claude 、Gemini 、Codex 、Cursor 、Grok 等相关场景的工具做了集中收录,同时涵盖临时邮箱、Token 管理、账号池编排等能力,整体是模块化组织,README 里的项目导航、快速开始、注意事项和故障排除也写得比较清晰,适合想系统了解这类工具链的开发者做参考和研究。 仓库采用 MIT 协议,我也折腾了一下,虽然很多方法可能无法顺利跑通,但这个集合还是挺有意思,适合爱折腾的。 声明我不是项目作者,我只是发现了自己...

超过系统支持期的 macbook pro&air 还能干什么

看到有 v 友发了 2015 年的 mac ,想起来自己的第一台就是 2015 款的 q2 好像,15 寸,大屏幕很爽。2020 年还因为电池问题可以更换了一次电池和 c 面,超值。更换完就二手出给学弟写前端了,回血 6500 元。所以之后 m1pro ,m2max 这种大内存的过两年超过系统支持期的,是当个 web 浏览器终端还是怎么,不知道 v 友们又什么脑洞嘛?...