商汤 + NTU 做了个不用 Vision Encoder 也不用 VAE 的多模态模型,结果还挺能打

博客: https://huggingface.co/blog/sensenova/neo-unify 叫 NEO-unify ,主要卖点是把多模态里最"理所当然"的两个组件都扔掉了: 1.不用 Vision Encoder ( CLIP/SigLIP 之类的) 2.不用 VAE 直接从原始像素出发,理解和生成两条路径都塞在一个叫 MoT ( Mixture-of-Transformer )的骨干里。文本用自回归交叉熵,图像生成用 pixel flow matching ,统一训练。 比较有意思的几个地方: 图像重建质量上,2B 的模型在 MS COCO 上跑出来 PSNR 31.56 / S...

E220P-400T22S LoRa Module In-depth Analysis: Cost-effective Solution for Industrial Wireless Communication

IntroductionAgainst the backdrop of rapid growth in the global wireless communication module market, QYResearch shows that the global wireless module market size reached US$6.972 billion in 2025, and is expected to exceed US$10.36 billion by 2032, with a CAGR of 5.9%. Among them, Sub-1GHz industrial...

虚拟机挂微信也会掉线

参考这个 t/1154274 ,我用 pve 跑虚拟机挂微信,第二天早上起来,比掉线,没想到微信也会检测虚拟机,看来只能在我的实体的小主机上挂微信测试一下是不是因为虚拟机的问题了...