Register and share your invite link to earn from video plays and referrals.

GitHubDaily
@GitHub_Daily
💡 挖掘开源的价值 🧑🏻‍💻 坚持分享 GitHub 上高质量、有趣、实用的教程、AI工具、前沿 AI 技术 🧐 A list cool, interesting projects of GitHub. ✏️ 公众号:GitHubDaily
Joined May 2023
202 Following    78.9K Followers
偶然看到 AI Data Extraction Toolkit 这个开源项目,可以用来一键提取各个 AI 编程助手的完整对话记录。 支持 Claude Code、Cursor、Codex、Windsurf、Gemini CLI 等八款主流工具,自动识别系统和安装路径,直接输出统一的 JSONL 格式。 GitHub: 提取的数据非常完整,不只是对话文本,还包括代码上下文、文件路径、代码差异、工具调用结果这些关键信息,拿来做模型微调刚好够用。 纯 Python 标准库实现,不需要装额外依赖,一个 shell 脚本,就能把所有工具的数据全部导出。 如果想用真实的编程对话数据来微调大模型,这个项目能帮我们省下大量收集数据的时间,值得收藏备用。
Show more