一个 Skill 搞定视频转录、内容摘要、思维导图与网页输出

最近刷到了 Yanonk 分享的视频[《一个 Claude Skill 搞定转录、摘要、思维导图和网页输出》](一个 Claude Skill 搞定转录、摘要、思维导图和网页输出),感觉特别实用也下来体验 了一番,效果确实惊艳。

GitHub地址https://github.com/LjyYano/skill-pack

这个仓库名字叫 skill-pack,听起来有点泛,但实际内容很明确:它不是一个单独的工具,而是一组给 Claude Code、Codex、OpenCode、OpenClaw 这类 AI 编程助手用的 skills。它想解决的事情也很日常:我们平时丢给 AI 的视频、播客、文章链接,最后不要只停留在聊天窗口里,而是能落成 Markdown、HTML 页面,甚至 Anki 卡片。

说白了,它把信息输入、总结、转录、思维导图、Markdown 笔记和 HTML 展示页串成一条本地化、可定制的流水线。

这套 skills 主要做什么

仓库里现在主要有四个 skill:

  • link-to-note
  • link-to-html
  • article-to-anki
  • video-to-note

真正推荐优先用的是前三个。video-to-note 还在,但更像旧版本留下来的视频专用流程。

我自己的理解是:

1
2
3
4
link-to-note   负责把链接整理成笔记
link-to-html 负责把笔记做成网页
article-to-anki 负责把文章拆成复习卡片
video-to-note 旧的视频笔记流程,能不用就先不用

这几个东西连起来之后,工作流就很顺:

1
2
3
4
5
视频 / 播客 / 文章

结构化 Markdown 笔记

HTML 阅读页 / Anki 卡片 / Obsidian 知识库

它最吸引我的地方不在“AI 总结”这四个字。现在能总结的工具太多了。真正有意思的是,它把总结之后的东西保存成了你能继续编辑、继续积累的文件。

link-to-note 是这个仓库里最应该先看的 skill。

它支持 YouTube、Bilibili、Apple Podcasts、小宇宙,以及其他 yt-dlp 能处理的音频链接。视频有字幕时,它会优先用字幕;没有字幕,或者是播客、音频链接时,才会走阿里 DashScope 的 ASR。

生成的不是一段简单摘要,而是一份比较完整的 Obsidian 风格笔记,通常会包含:

  • 摘要

    image-20260531201513856

  • Takeaways

    image-20260531201229328

  • 思维导图

    image-20260531201058680

  • 章节导读

    image-20260531201448780

  • 金句

    image-20260531201256471

  • 详细论点
    image-20260531201237971

  • 完整转录

    image-20260531201338629

如果你平时看很多长视频,尤其是技术视频,这个 skill 很有用。因为看完一个视频最难的不是“知道它讲了什么”,而是过两周还能不能快速找回里面真正有用的部分。

用法大概是这样:

1
2
用 link-to-note 总结这个 B 站视频,生成 Obsidian 笔记:
https://www.bilibili.com/video/xxxx

参考视频里重点演示的就是这个方向:把内容整理成一个网页。

link-to-html 的作用是读取 link-to-note 生成的 Markdown 笔记,然后做成一个单文件 HTML。这个页面不是普通 Markdown 预览,它更像一个小型内容阅读器:左侧导航、摘要区、关键词、章节、金句、转录搜索、思维导图都放在一起。

它适合两种场景:

第一种是自己复盘。长视频笔记放在 Markdown 里会很长,但做成 HTML 后,找章节、找关键词、看思维导图都轻松很多。

第二种是分享。你不一定想把一整份 Obsidian 笔记发给别人,但一个 HTML 页面就很直接,浏览器打开就能看。

用法可以是:

1
2
用 link-to-html 把这个视频笔记生成 HTML:
D:\Desktop\note.md

也可以直接给 URL,让它先走 link-to-note,再生成 HTML:

1
2
用 link-to-html 处理这个视频链接,生成 HTML 页面:
https://www.bilibili.com/video/xxxx

article-to-anki:把文章拆成卡片

article-to-anki 是另一个很实用的小 skill。

它不是把文章改写成摘要,而是把文章里的知识点拆成 Anki 可以用的 Markdown 卡片。它的规则挺克制:一张卡片只放一个独立思想,用无序列表写清楚,重点词语加粗,不做那种生硬的填空题。

这点我挺喜欢。很多“AI 生成卡片”的结果会很像考试题,看起来认真,复习起来很累。这个 skill 的思路更像是帮你把文章重新切成几个能记住的知识块。

用法:

1
2
用 article-to-anki 把这篇文章做成 Anki 卡片:
https://example.com/article

输出会放到类似 AI/Anki/文章标题.md 这样的路径里。

video-to-note:旧流程,可以先放着

video-to-note 也能处理 YouTube 和 Bilibili 视频,生成视频笔记。

不过仓库 README 里已经说得很清楚:新用法优先选 link-to-note。因为 link-to-note 覆盖范围更宽,不只管视频,也能管播客和音频链接;而且新流程里 Bilibili 会走 REST API,不再死磕容易出 412 的 yt-dlp 路线。

所以我的建议是:

  • 新用户直接用 link-to-note
  • 只有你在维护旧工作流时,再看 video-to-note

它和普通总结工具的区别

这个仓库最有价值的点,是它没有把 AI 当成“回答机器”,而是把 AI 放进了一个文件工作流里。

普通总结工具通常是这样:

1
输入链接 → 得到一段总结 → 看完就结束

skill-pack 更像这样:

1
2
3
4
5
输入链接
→ 生成 Markdown
→ 进入 Obsidian
→ 生成 HTML
→ 需要复习时再拆 Anki

这两个体验差很多。

前者适合临时了解,后者适合长期积累。尤其是对我这种经常看视频、收藏文章、又不想让内容散在聊天记录里的人来说,后者明显更实用。

使用前要注意的事

这个仓库不是“装上就万事大吉”的那种工具。它有几个前置条件要留意。

link-to-note 处理视频和音频时,可能需要:

  • python3
  • requests
  • yt-dlp
  • ALIYUN_API_KEY

其中 ALIYUN_API_KEY 是给没有字幕的视频、播客和音频 ASR 用的。如果视频本身有字幕,通常就不用走 ASR。

link-to-html 相对简单,它主要需要一份符合结构的 Markdown 笔记。思维导图部分依赖浏览器加载 markmap 相关 CDN,所以完全离线时可能不会渲染。

article-to-anki 则取决于助手能不能把网页正文提取出来。如果网页反爬严重,可能需要换成本地文章文件。

我会怎么用

如果只装了这个仓库,我会按这个顺序开始:

1
2
3
第一步:用 link-to-note 处理视频或播客
第二步:用 link-to-html 把笔记变成网页
第三步:遇到好文章,再用 article-to-anki 做复习卡片

video-to-note 暂时不用管。

一个比较完整的使用方式是:

1
2
用 link-to-note 总结这个视频,生成 Obsidian 笔记:
https://www.bilibili.com/video/xxxx

然后:

1
用 link-to-html 把刚才生成的笔记做成 HTML,保存到桌面。

如果是一篇长文章:

1
2
用 article-to-anki 把这篇文章拆成 Anki 卡片:
https://example.com/article

总结

LjyYano/skill-pack 不是那种装完就让人惊呼的花哨项目,但它很实用。它处理的是一个真实痛点:我们每天看了太多内容,但真正留下来的太少。

这几个 skill 做的事情,就是把“看过”往“留下来”推了一步。

link-to-note 负责沉淀,link-to-html 负责展示,article-to-anki 负责复习。三者合起来,就是一条从链接到知识库的小流水线。

如果你本来就用 Obsidian,或者经常让 AI 帮你整理视频、播客、文章,这个仓库值得装。它不会替你思考,但能帮你把材料收拾得更像样。对知识管理来说,这已经很有用了。