Lattifai 路线图
了解我们未来三个月的开发路线图和即将推出的功能。加入我们的 Discord 社区,参与开发过程。
0
2025.10.12
已完成
Lattifai 网站和基础服务上线
重点更新
- 基础架构建设,网站上线
1
2025.10.18
已完成
发布 Lattice-1-Alpha (支持英文)
重点更新
- 开放使用:开放 Lattice-1-Alpha 测试使用
- 模型/服务:确保 Lattice-1-Alpha 稳定,支持 30分钟到1小时的英文内容处理
- 基础架构:部署网站、API 和用户管理系统
- 社区建设:建立并启动 Discord 社区服务器,引导早期用户进入并开始收集反馈
关键能力
- 发布 Lattice-1-Alpha
- Discord 社区启动
2
2025.11.30
即将到来
正式发布 Lattice-1 正式版本 (支持中英德三种语言、长时数据处理)
重点更新
- 模型升级:集成对中文、英文、德文以及中英混合音视频数据的完整支持,提供生产级别的多语言处理能力
- 语音转写:新增高精度语音转写(ASR)功能
- 说话人识别:集成说话人分离(Speaker Diarization)技术,自动识别和标记不同说话人的语音片段
- 性能优化:支持长达 20 小时的连续音视频处理,通过资源优化和内存管理实现稳定的长时处理
- 硬件加速:实现对 NVIDIA GPU 和 Apple Silicon 的完整支持,大幅提升处理速度和效率
关键能力
- 正式发布 Lattice-1 生产版本
- 核心功能:支持中/英/德三语言,支持长达 20 小时媒体文件处理
- 说话人分离与识别能力
- GPU 和 Apple Silicon 硬件加速
- 完整的 API 和 SDK 支持
3
2026.01.04
即将到来
下一代 Lattice-2 模型 (支持20+语言和副语言信息标记)
重点更新
- 副语言标记:集成副语言(Paralinguistic)信息识别,精准标注呼吸声、笑声、咳嗽、犹豫、背景噪音等非语言音频事件
- 语言扩展:支持全球主流的 20+ 种语言,包括中、英、德、法、西、日、韩、阿拉伯语等,覆盖全球 80% 以上人口
- 语音翻译:集成端到端语音翻译功能,支持多语言之间的实时翻译和字幕生成
- 情感分析:新增语音情感识别能力,分析说话人的情绪状态(如愉悦、愤怒、悲伤、平静等)
关键能力
- 发布下一代完全端到端的 Lattice-2 模型
- 支持 20+ 主流语言的语音识别与翻译
- 副语言事件检测与情感分析
- 完整的说话人识别与分离能力
- 企业级 API 服务和开发者生态
- Lattifai 平台全面上线,提供完整的音视频处理解决方案
社区和反馈
Alpha 和 Lattice-1 阶段
Discord 作为实时 Bug 报告和功能请求的主要渠道。通过设立专门的频道(如 #lattice-1-alpha-bugs, #feature-requests)。
正式发布后
Discord 将继续作为用户社区、技术支持和未来功能讨论的长期阵地,保持产品迭代的活力。