DialoCast 是一个基于 Electron 的桌面应用,利用人工智能技术帮助用户快速生成和制作双人播客内容。通过 MINIMAX AI 的强大模型支持,可以轻松创建高质量的播客脚本并将其转换为语音音频。
-
主题输入:
- 用户输入播客主题后,AI 自动生成结构化的双人播客脚本。
- 支持中文/英文两种语言选择。
-
语音合成:
- 将生成的脚本转换为真人语音,支持两种不同音色和情绪调节。
- 提供音调、语速、情感表达等参数调整选项。
-
可定制化输出:
- 根据需求调整人声、音调、语速和情感表达。
- 支持多种音频格式输出(如 MP3、WAV)。// TODO: WAV
-
价格控制:
- 单次使用成本人民币0.5元左右。
- 历史记录管理:保存生成的音频文件。
- 导出功能:支持将生成的内容导出为多种格式。// TODO
- 模板库:提供多种播客主题模板,方便用户快速上手。// TODO
- 前端:
- Electron 框架,提供跨平台桌面应用体验。
- React / shadcn 库用于构建用户界面。
- AI 集成:
- MINIMAX 文本生成模型进行播客脚本创作。
- MINIMAX 语音合成 API 将文本转换为语音。
dialo-cast/
├── src/ # 源代码目录
│ ├── main/ # 主进程代码(管理应用生命周期)
│ ├── renderer/ # 渲染进程代码(UI 组件和逻辑)
│ └── services/ # 服务层(API 调用和业务逻辑)
├── package.json # 项目依赖和脚本配置
├── tsconfig.json # TypeScript 配置文件
└── webpack.*.ts # Webpack 打包配置
npm install
npm run start
npm run build
在启动应用之前,确保设置以下环境变量:
MIN_MAX_API_KEY
:MINIMAX 提供的 API 访问密钥。MIN_MAX_GROUND_ID
:注册 MINIMAX 后的用户Group ID。
在项目根目录创建 .env
文件:
MIN_MAX_API_KEY=your_api_key_here
MIN_MAX_GROUND_ID=your_minimax_groupid