Lazy loaded image
🏗️YouTube Analyzer 系统架构文档 (含 Mermaid 图表)
Words 1957Read Time 5 min
2025-12-26
2025-12-26
type
status
date
slug
summary
tags
category
icon
password
本文档详细说明了 YouTube Analyzer 系统的完整架构,包含6个可交互的 Mermaid 架构图。
💡
Mermaid 图表在 Notion 中完全可渲染!点击图表可查看大图和详细内容。

1️⃣ 整体架构图

展示了系统的所有组件:数据源、定时任务、核心服务、Discord Bot、HTTP API、AI模型选择、处理流程和数据库。

2️⃣ YouTube 视频处理流程

时序图展示了从定时任务触发到最终保存的完整流程,包括双重字幕获取机制和AI模型选择逻辑。

3️⃣ Blog/Substack 处理流程

RSS feed 解析、AI分析、并行发送到 Discord/Notion/Database 的完整流程。

4️⃣ Discord Bot 交互流程

展示了4种交互场景:右键菜单分析、/analyze 命令、/知识库查询、/演讲分析的完整流程。

5️⃣ AI 模型智能选择逻辑

流程图展示了根据内容语言和是否包含图片自动选择最佳 AI 模型的决策树。

6️⃣ 数据库 Schema (ER 图)

展示了核心数据表及其关系:Video、BlogPost、订阅表、知识库、演讲分析等。

📦 系统组成部分

数据源 (4类)

  • YouTube Channels - 15个频道订阅,每日自动检查
  • Blog RSS Feeds - 13个博客订阅,每6小时检查
  • Substack Publications - 通过RSS,每小时检查
  • Notion Database - 手动剪藏的文章,每15分钟检查

核心服务 (8个)

  • FeedMonitorService - YouTube RSS解析和新视频检测
  • BlogMonitorService - Blog RSS解析和新文章检测
  • SubstackService - Substack内容获取
  • YouTubeService - 视频元数据和字幕获取(youtubei.js + YouTube API双降级)
  • AIService - OpenRouter AI分析(智能模型选择:GPT-5.1/DeepSeek V3/Gemini 2.5 Pro)
  • DiscordService - Discord Rich Embed通知(自动拆分长内容)
  • NotionService - Notion自动发布(Markdown → Blocks转换 + SEO优化)
  • NotionReaderService - 读取手动剪藏的Notion文章

🛠️ 技术栈

后端框架:Node.js + TypeScript + Express + Prisma
数据存储:PostgreSQL (Neon) + pgvector
AI服务:OpenRouter (GPT-5.1 / DeepSeek V3 / Gemini 2.5 Pro / GPT-4o)
部署平台:Railway (容器化部署 + 自动CI/CD)

✨ 关键特性

  • 双重字幕获取机制 - 优先youtubei.js(无API配额) → 降级YouTube Data API
  • 智能AI模型选择 - 根据语言和内容类型自动选择最佳模型
  • 多渠道内容聚合 - YouTube + Blog RSS + Substack + Notion手动剪藏
  • 容错机制 - Discord失败不影响Notion,数据库事务回滚,缓存防重
  • SEO优化 - Notion标题优化、自动生成slug、智能tags分类

📚
完整的技术文档和配置说明请查看 GitHub 仓库中的 ARCHITECTURE.md 和 CLAUDE.md 文件。
上一篇
Google Ads Performance Max 2025年6大新功能完整指南(附AI Max详解)
下一篇
Miss Jin