目录

推荐-6-个本周-yyds-的-GitHub-项目

推荐 6 个本周 yyds 的 GitHub 项目。

01

微软开源的文档转换工具

MarkItDown 用于将各种常见格式的文档转换为 Markdown 格式。

包括 PDF、PPT、Word、Excel、图片、音频、HTML、JSON等,甚至还能处理 ZIP 压缩包内的多个文件、YouTube 视频转录文本以及电子书 EPub 等。

https://i-blog.csdnimg.cn/img_convert/991774905440420d5b3beb055b139270.jpeg

它尤其适合需要将文档内容提取为结构化文本,并用于大模型处理或文本分析任务的情景。

其实仅限这个场景,因为项目官方说可以保留表格、排版啥的**,实测并没有。。。**

PDF 文件转换,左边屏是源文件,右半屏是转换后的MD,发现标题并没有保留。

https://i-blog.csdnimg.cn/img_convert/f8e75f1f20a6e62e501c13883d403782.jpeg

表格类型 PDF 的转换效果如下,其实得到的 Markdown 效果就比较差了。

https://i-blog.csdnimg.cn/img_convert/9015efcabcd3ad4fb501a777833e0b59.jpeg

如果是转换比较标准的 Excel 表格,效果还是不错的:

https://i-blog.csdnimg.cn/img_convert/a94eba40fb38499e3f218db20f347f7c.jpeg

再来看看 PPT 文件,转换的效果,emmmm

这是提取文字吧。。

https://i-blog.csdnimg.cn/img_convert/676bbc9b2188b94a4589c92a2370ebc2.jpeg

02

命令行 AI 编程助手

Codebuff 也是一个基于命令行的 AI 编程助手。

它不像许多工具那样只依赖一个大模型,而是采用一种多智能体协同工作的架构。

它个任务,协调多个各司其职的智能体一起工作。

https://i-blog.csdnimg.cn/img_convert/74aa7a91d288e98f4ad5a62ba7fb0036.jpeg

项目官方说在模拟真实任务的评估中,成功率达到了 61%,优于 Claude 53%。

https://i-blog.csdnimg.cn/img_convert/6967c7f22848fd62b5c5bb7761da0699.jpeg

使用 Codebuff 非常简单,通过 npm 全局安装它之后,进入你的项目目录,在终端里直接运行 codebuff 命令,然后用自然语言告诉它你想做什么。

https://i-blog.csdnimg.cn/img_convert/ee8b2e0456b94a9a0d3e246065ad3ee1.jpeg

03

推特推荐算法

这个开源项目是推特自家平台最核心的推荐算法。

包含了一系列服务、任务和框架,它们共同协作,来决定用户会在「为你推荐」时间线、搜索、探索页和通知中看到什么内容。

它并不是一个单一算法,而是一整套复杂的技术生态。

感兴趣的去看看吧。

https://i-blog.csdnimg.cn/img_convert/2704a5e254a896500d7a5000744be31e.jpeg

04

Mac 电脑上运行大模型

mlx-lm 是一个专为苹果芯片设计的开源项目,让用户能轻松地在 Mac 电脑上运行各种大语言模型。

https://i-blog.csdnimg.cn/img_convert/d5b70aa5f629aefc4767a866dd3e2b3a.jpeg

使用 pip 或 conda 即可快速安装。

https://i-blog.csdnimg.cn/img_convert/601c058d02edd1337a9a662d9635766a.jpeg

安装后,无需编写代码,直接在终端中输入简单命令,就可以让模型回答问题或进行多轮对话,非常方便。

而且它成了 Hugging Face Hub,发现好玩的模型直接下载就行了。这个开源项目可能比较小众,不做更多介绍,感兴趣自己去看看。

05

Perplexity 开源平替

Perplexica 是知名产品 Perplexity AI 的开源替代方案。支持 Mac、Linux、Windows。

https://i-blog.csdnimg.cn/img_convert/0100b72f7c0e2577e1707cfa22a9489a.jpeg

是一个由 AI 驱动的搜索引擎,与传统搜索不同,Perplexica 不仅仅返回一堆链接。

它会在理解用户问题意图的基础上,自动抓取网络信息,并对内容进行梳理和整合,最终生成一个清晰、连贯且带有来源引用的答案。

https://i-blog.csdnimg.cn/img_convert/1e039cf96fff3168efff57634f25cf29.jpeg

06

ChinaTextbook

之前介绍过,这个开源项目又登上了本周 GitHub 热搜。

项目的主要目标是收集并免费分享中国内地小学、初中、高中乃至大学的PDF版教材。

https://i-blog.csdnimg.cn/img_convert/0ff5f86624e50fae6ad5e79f9241bbb6.jpeg

比如小学中的课程,数学、美术、科学、英语、语文,甚至体育与健康、艺术、书法、音乐等等 10 大课程配套的教学材料都有。

https://i-blog.csdnimg.cn/img_convert/3b6a0b22df67130dc2c9b87cabce20a7.jpeg

https://i-blog.csdnimg.cn/img_convert/d6ecfd8a3c33efac76cf055fdbdbd7d8.jpeg

最后总结

如果你对编程感兴趣,想要学习python、人工智能、Java、前端,这里给大家分享一份编程全套学习资料,都是我自己学习时整理的,希望可以帮到你,一起加油!

1️⃣零基础入门

① 学习路线

对于从来没有接触过编程的同学,我们帮你准备了详细的学习成长路线图。可以说是最科学最系统的学习路线,你可以按照上面的知识点去找对应的学习资源,保证自己学得较为全面。

https://i-blog.csdnimg.cn/img_convert/e6c046a2e38a8c46aa47c5edfcf0e501.jpeg

② 路线对应学习视频

还有很多适合0基础入门的学习视频,有了这些视频,轻轻松松上手编程~

https://i-blog.csdnimg.cn/img_convert/534d5a6797128227534bba5460c93564.jpeg

2️⃣国内外书籍、文档

① 文档和书籍资料

https://i-blog.csdnimg.cn/img_convert/43663ddc62eab5ffa3dc83b8b0c2230f.jpeg

3️⃣工具包+项目源码合集

①Python工具包

学习Python常用的开发软件都在这里了!每个都有详细的安装教程,保证你可以安装成功哦!

https://i-blog.csdnimg.cn/img_convert/74da14fd859414e688a975d3c5492742.png

②编程实战案例

光学理论是没用的,要学会跟着一起敲代码,动手实操,才能将自己的所学运用到实际当中去,这时候可以搞点实战案例来学习。100+实战案例源码等你来拿!

https://i-blog.csdnimg.cn/img_convert/66dc74ed6af4a9ecfc87cb30265a1ee5.jpeg

③小游戏源码

如果觉得上面的实战案例有点枯燥,可以试试自己用Python编写小游戏,让你的学习过程中增添一点趣味!

https://i-blog.csdnimg.cn/img_convert/7c3916253b8036c3fe9f5da8e66ece51.jpeg

4️⃣大厂面试题

我们学会了编程之后,有了技能就可以出去找工作啦!下面这些面试题是都来自阿里、腾讯、字节等一线互联网大厂,并且有阿里大佬给出了权威的解答,刷完这一套面试资料相信大家都能找到满意的工作。

https://i-blog.csdnimg.cn/img_convert/fae38662511750438869938cd4790712.jpeg

https://i-blog.csdnimg.cn/img_convert/4cade2660fa4c321e9ab371af803eb46.jpeg

完整版获取方式:https://i-blog.csdnimg.cn/direct/3b08235f7c0b4e24b74a5009955a0ec0.png