Skip to content

AudioNotes - 让音视频内容秒变结构化笔记,AI 助你高效整理信息

简介​

AudioNotes 是一款基于 FunASR 和 Qwen2 构建的开源音视频转笔记系统,旨在帮助用户高效地将音视频内容转化为结构化的 Markdown 笔记。​

主要功能​

  • 高精度语音识别:利用 FunASR 技术,准确提取音视频中的文字内容。

  • 智能内容整理:通过 Qwen2 模型,将提取的文本整理为清晰的结构化笔记,便于阅读和后续参考。

  • 交互式对话功能:支持用户与音视频内容进行对话,深入挖掘信息价值。

  • 灵活的部署方式:提供 Docker 和本地部署两种方式,满足不同用户的需求。​

关键词

AudioNotes, 音频转文字, 视频转笔记, AI 笔记整理, FunASR, Qwen2, 开源工具, Markdown 笔记, 语音识别, Docker 部署

安装

docker-compose

yaml
services:
  webui:
    image: harryliu888/audio-notes
    container_name: audio_notes_webui
    ports:
      - 15433:15433
    volumes:
      - ./modelscope:/root/.cache/modelscope
      - ./storage:/app/storage
    restart: always
    networks:
      - audio_notes
    environment:
      # 登录账号
      - USERNAME=admin
      - PASSWORD=admin
      # 数据库配置(需要与下面pg服务的配置一致)
      - POSTGRES_USER=username
      - POSTGRES_PASSWORD=password
      - POSTGRES_DB=audio_notes
      - POSTGRES_HOST=pg
      # ollama配置
      - OLLAMA_BASE_URL=http://host.docker.internal:11434/v1
      - OLLAMA_MODEL=qwen2:7b
      - OLLAMA_API_KEY=ollama
    depends_on:
      - pg
    extra_hosts:
      - 'host.docker.internal:host-gateway'
  pg:
    image: postgres:12.19-bullseye
    container_name: audio_notes_pg
    restart: always
    ports:
      - 15432:5432
    networks:
      - audio_notes
    environment:
      # 这里的配置只有首次运行生效。修改后,重启镜像是不会生效的。需要把持久化数据删除再重启,才有效果
      - POSTGRES_USER=username
      - POSTGRES_PASSWORD=password
      - POSTGRES_DB=audio_notes
    volumes:
      - ./postgresql:/var/lib/postgresql/data
networks:
  audio_notes:

链接

https://github.com/harry0703/AudioNotes