Lattifai 路线图

了解我们未来三个月的开发路线图和即将推出的功能。加入我们的 Discord 社区,参与开发过程。

0
2025.10.12
已完成
Lattifai 网站和基础服务上线

重点更新

  • 基础架构建设,网站上线
1
2025.10.18
已完成
发布 Lattice-1-Alpha (支持英文)

重点更新

  • 开放使用:开放 Lattice-1-Alpha 测试使用
  • 模型/服务:确保 Lattice-1-Alpha 稳定,支持 30分钟到1小时的英文内容处理
  • 基础架构:部署网站、API 和用户管理系统
  • 社区建设:建立并启动 Discord 社区服务器,引导早期用户进入并开始收集反馈

关键能力

  • 发布 Lattice-1-Alpha
  • Discord 社区启动
2
2025.11.30
即将到来
正式发布 Lattice-1 正式版本 (支持中英德三种语言、长时数据处理)

重点更新

  • 模型升级:集成对中文、英文、德文以及中英混合音视频数据的完整支持,提供生产级别的多语言处理能力
  • 语音转写:新增高精度语音转写(ASR)功能
  • 说话人识别:集成说话人分离(Speaker Diarization)技术,自动识别和标记不同说话人的语音片段
  • 性能优化:支持长达 20 小时的连续音视频处理,通过资源优化和内存管理实现稳定的长时处理
  • 硬件加速:实现对 NVIDIA GPU 和 Apple Silicon 的完整支持,大幅提升处理速度和效率

关键能力

  • 正式发布 Lattice-1 生产版本
  • 核心功能:支持中/英/德三语言,支持长达 20 小时媒体文件处理
  • 说话人分离与识别能力
  • GPU 和 Apple Silicon 硬件加速
  • 完整的 API 和 SDK 支持
3
2026.01.04
即将到来
下一代 Lattice-2 模型 (支持20+语言和副语言信息标记)

重点更新

  • 副语言标记:集成副语言(Paralinguistic)信息识别,精准标注呼吸声、笑声、咳嗽、犹豫、背景噪音等非语言音频事件
  • 语言扩展:支持全球主流的 20+ 种语言,包括中、英、德、法、西、日、韩、阿拉伯语等,覆盖全球 80% 以上人口
  • 语音翻译:集成端到端语音翻译功能,支持多语言之间的实时翻译和字幕生成
  • 情感分析:新增语音情感识别能力,分析说话人的情绪状态(如愉悦、愤怒、悲伤、平静等)

关键能力

  • 发布下一代完全端到端的 Lattice-2 模型
  • 支持 20+ 主流语言的语音识别与翻译
  • 副语言事件检测与情感分析
  • 完整的说话人识别与分离能力
  • 企业级 API 服务和开发者生态
  • Lattifai 平台全面上线,提供完整的音视频处理解决方案

社区和反馈

Alpha 和 Lattice-1 阶段

Discord 作为实时 Bug 报告和功能请求的主要渠道。通过设立专门的频道(如 #lattice-1-alpha-bugs, #feature-requests)。

正式发布后

Discord 将继续作为用户社区、技术支持和未来功能讨论的长期阵地,保持产品迭代的活力。

加入我们的 Discord 社区

参与开发过程,获取最新更新,并与其他用户和开发团队直接交流。

加入 Discord