新的开源形式

作者：蓝逸日期：2026-03-30 浏览：1701℃ 分类：分享

开源的是这几天火热的语音输入法 AI 编程指令，具体说是一段一次性完成一个应用开发的指令，原作者使用 claude code ，我使用 codex 复刻。原帖： https://x.com/yetone/status/2038183163579810024原帖项目： https://github.com/yetone/voice-input-src我复刻的项目： https://github.com/jovix0101/voice-ime我是用 codex 复刻的，使用 gpt-5.4 模型，一次性成功，可运行使用。shellmkdir -p voice-ime && cd voice-ime && \codex exec \ --full-auto \ --sandbox danger-full-access <<'EOF'请实现一个 macOS menu-bar 语音输入法应用（ Swift ，macOS 14+），具体要求：1. 按住 Fn 键录音，松开后将转录文字注入当前聚焦的输入框。优先使用流式转录（ Apple Speech Recognition framework ）。Fn 键通过 CGEvent tap 全局监听，需抑制 Fn 事件传递以防止触发 emoji 选择器。2. 默认语言必须为简体中文（ zh-CN ），确保开箱即用就能识别中文输入。同时在菜单栏提供语言切换选项（英语、简体中文、繁体中文、日语、韩语）。语言选择存储在 UserDefaults 中。3. 录音时在屏幕底部居中显示一个特别优雅精致的无边框胶囊状悬浮窗，不要有红绿灯和 titlebar 。使用 NSPanel （ nonactivatingPanel ）+ NSVisualEffectView （.hudWindow 材质），高度 56px ，圆角半径 28px ，包含： - 左侧 5 根竖条波形动画（ 44×32px ），必须由实时音频 RMS 电平驱动。说话声音大波形就大，安静时波形就小。权重为 [0.5, 0.8, 1.0, 0.75, 0.55]，带平滑包络（ attack 40%、release 15%），每根竖条加入 ±4% 随机抖动，波形清晰可见。 - 右侧文字标签（宽度 160-560px 自适应）实时显示转录文本，随内容增长自动扩展 - 入场弹簧动画（ 0.35s ）、宽度过渡（ 0.25s ）、退场缩放动画（ 0.22s ）4. 文字注入使用剪贴板 + 模拟 Cmd+V 。注入前检测输入法，如为 CJK 输入法则临时切换到 ASCII （ ABC/US ），粘贴完成后恢复原输入法，并恢复剪贴板内容。5. 接入 LLM 提升识别准确率（支持 OpenAI 兼容 API ）。可配置 API Base URL 、API Key 、Model 。LLM 只允许“极保守纠错”：仅修复明显识别错误（如“配森→Python”、“杰森→JSON”），禁止改写或润色。6. 菜单栏提供 LLM Refinement 子菜单（启用开关 + Settings ）。Settings 包含 API Base URL 、API Key 、Model 输入框，支持清空 API Key ，并有 Test 和 Save 按钮。松开 Fn 后若启用 LLM ，则显示“Refining...”并在完成后注入文本。7. 应用使用 LSUIElement 模式运行（仅菜单栏，无 Dock 图标）。使用 Swift Package Manager 构建，提供 Makefile （ build/run/install/clean ），输出为签名 .app bundle 。 [工程要求] - 在当前目录创建完整项目（ SPM ）- 项目名：VoiceIME- 自动创建目录结构和所有 Swift 文件- 自动生成 Makefile [执行策略] - 自动 build 项目- 如果 build 失败，自动分析并修复- 最多循环 5 次，直到成功- 最终输出运行方式EOFtokens used72,670

转载注明出处：http://dixi.eu.org/32475.html

上一篇我为 ideogram 举大旗！

下一篇兄弟们，来薅千问羊毛了