Appearance
AudioNotes - 让音视频内容秒变结构化笔记,AI 助你高效整理信息
简介
AudioNotes 是一款基于 FunASR 和 Qwen2 构建的开源音视频转笔记系统,旨在帮助用户高效地将音视频内容转化为结构化的 Markdown 笔记。
主要功能
高精度语音识别:利用 FunASR 技术,准确提取音视频中的文字内容。
智能内容整理:通过 Qwen2 模型,将提取的文本整理为清晰的结构化笔记,便于阅读和后续参考。
交互式对话功能:支持用户与音视频内容进行对话,深入挖掘信息价值。
灵活的部署方式:提供 Docker 和本地部署两种方式,满足不同用户的需求。
关键词
AudioNotes, 音频转文字, 视频转笔记, AI 笔记整理, FunASR, Qwen2, 开源工具, Markdown 笔记, 语音识别, Docker 部署
安装
docker-compose
yaml
services:
webui:
image: harryliu888/audio-notes
container_name: audio_notes_webui
ports:
- 15433:15433
volumes:
- ./modelscope:/root/.cache/modelscope
- ./storage:/app/storage
restart: always
networks:
- audio_notes
environment:
# 登录账号
- USERNAME=admin
- PASSWORD=admin
# 数据库配置(需要与下面pg服务的配置一致)
- POSTGRES_USER=username
- POSTGRES_PASSWORD=password
- POSTGRES_DB=audio_notes
- POSTGRES_HOST=pg
# ollama配置
- OLLAMA_BASE_URL=http://host.docker.internal:11434/v1
- OLLAMA_MODEL=qwen2:7b
- OLLAMA_API_KEY=ollama
depends_on:
- pg
extra_hosts:
- 'host.docker.internal:host-gateway'
pg:
image: postgres:12.19-bullseye
container_name: audio_notes_pg
restart: always
ports:
- 15432:5432
networks:
- audio_notes
environment:
# 这里的配置只有首次运行生效。修改后,重启镜像是不会生效的。需要把持久化数据删除再重启,才有效果
- POSTGRES_USER=username
- POSTGRES_PASSWORD=password
- POSTGRES_DB=audio_notes
volumes:
- ./postgresql:/var/lib/postgresql/data
networks:
audio_notes: