百度文心和其他模型的一个重大的不同点

百度的模型是针对中文的,它的 Tokenizer 对英文进行编码的效率特别低,大概两个字母一个 token ,接近字符计数 现在市面上其他的模型基本上是 BPE 编码,编码中文的效率相对低,token 大概是中文字符数*2 的程度 总的来讲在其他模型里面中文水土不服,而在百度这里英文水土不服,而其水土不服的程度超过中文在其他模型的水土不服程度 从结果看,用于 GPT 的英文 prompt 不能直接用于文心,prompt 必须改成中文,并且回复大概率也是中文,做不了国际化的出海应用,只能国内自己用。 可以说是内循环的急先锋了。 ...

分享关于重疾险的看法

看到一位 V 友分享了自己的配置保险心得,就心血来潮也想分享一下自己的看法。不一定准确可靠,仅供参考。 我本科金融,之前毕业在传统保险公司干了半年多组训,现在转行后端,对保险稍微有些了解。 重疾险本质上一个金融杠杆工具,用小的保费去撬动大的保额。 比如买一款重疾险,保费 3000 ,交 20 年,总保费 6w ,保额 50w,杠杆率就近似 830%左右。 上面那个算法不准确,其实还会更高,因为存在提前出险的可能,传统重疾险出险后,就直接赔付,合同终止,不需要交保费了。比如投保后 1 年就出险,直接赔付 50w 。 因为保险公司都是盈利机构,所以从数学上来说,有如下简易公式: (保费 + 保险公...

手工用命令行启动 clash

将下列内容存为 bat 文件 clash-windows-amd64.exe 可以放在任何地方,内容中的路径需要修改 双击即可启动或关闭 正常启动是最小化,如果想隐藏窗口的话,请使用管理员模式(关闭的时候也要用管理员模式) 适用于 Windows 如果想看日志,可以在配置文件中配置一下 external-controller,就可以用浏览器查看 启动脚本 @echo off reg add "HKCU\Software\Microsoft\Windows\CurrentVersion\Internet Settings" /v ProxyEnable /t REG_DWORD /d 1 /f...

年近 30,配置了人生第一份保险,和大家分享一些购买心得。

如果你决定了要买保险,越早买越好,不仅仅是价格便宜许多,如果在身体出现了某些疾病再去买,保费上涨是肯定的,绝大多数情况下保险公司直接就不让你参保了。为什么要买商业保险?随着年龄的增大,结婚以后,愈发感到身上的担的责任越来越大,父母逐渐老去,未来还有孩子要养,还有房贷要还,我因为工作的原因,还经常上夜班,作为家庭重要的经济来源,希望就算我不在了或者生大病了,整个家庭还能正常的生活下去。至于保险可不可靠,能不能赔付,这里我就不讨论了,有兴趣的可以自己搜下。说下要配置的几个险种,网上的保险五花八门,总结下来就是四个保险:重疾险➕寿险➕百万医疗险➕意外险。这里面最为重要也是价格最高的就是重疾险,我主要...