Auto Byte

专注未来出行及智能汽车科技

微信扫一扫获取更多资讯

Science AI

关注人工智能与其他前沿技术、基础学科的交叉研究与融合发展

微信扫一扫获取更多资讯

思、一鸣报道

Github中文项目排行榜,你永远想不到开发者都用它干了什么

没事逛一逛中文项目排行榜,什么下载插件、投资理财、求职面试、买房指南,你会打开 GitHub 的新世界大门。 当然,还是有编程指南、机器学习之类的正经项目。

不久前,有 GitHub 用户吐槽说,GitHub 的每日趋势榜不按照国家和地区来区分,使得榜单上总会有很多点赞量很大的中文项目,有时候甚至会占据半壁江山。这位用户呼吁,GitHub 应该按照开发者所属国家和地区进行项目排行。

从今天(2019 年 10 月 10 日)的榜单来看,确实有一部分项目是中文的。

没等 GitHub 做出来这个功能,强大的中国开发者就出手了。最近,一位名为 kon9chunkit (https://github.com/kon9chunkit) 的 GitHub 开发者就总结了中文相关的知名项目,并形成了每周榜单。这个榜单会定期更新每周最受欢迎的中文项目(top200)。更好的是,除了一个总榜单,开发者还将榜单按照编程语言进行了区分,如 Java、Python、C++等,形成了 17 个编程语言分榜。在排行榜上,每个项目不仅有名称和链接,还有点赞量、介绍、分类信息等。

项目地址:https://github.com/kon9chunkit/GitHub-Chinese-Top-Charts

总榜排行

机器之心首先看了一下项目总榜。总榜可以说是包罗万象,从各类教程(前端、后端、面试、机器学习)到各种框架(电商、小程序、web),还有很多数据集和经验类的分享等。

我们可以发现,项目中有很多熟悉的面孔,例如深度学习 500 问、春秋招 ML 算法笔记和结巴分词等等,它们都是按照 Star 量进行排序的,总榜包括 200 项流行的项目,如下只展示了前 20。

10 月 9 日更新的排行榜。目前排行第一的是程序员面试题大全。

除此之外,还有更多我们熟悉的 ML 项目也在总榜内,例如 HanLP 提供的自然语言处理工具、动手学深度学习中文书籍、百度 PaddlePaddle 框架,以及西瓜书公式推导等等。因为优秀的中文项目非常多,且每一个项目都会有描述,所以逛一逛也能发现新大陆。

作者表示,选择中文榜单有以下几点要求:

  • 项目 Description 和 Readme.md 需要包含中文说明;

  • 近一年内有过更新;

  • 按 star 量排名,越高越靠前。

作者也表示,如果要持续提升编程水平,也需要多看看英文的项目。

Python 分榜

对于 Python 开发感兴趣的读者们,机器之心专门看了一下 Python 榜单。

相比总榜,Python 分榜中的项目更加集中在几个主题中:资料和面试题、机器学习相关资料和算法实现、爬虫、数据集。一些著名的项目,如结巴分词、《动手学深度学习》等都在榜上。

虽然并没有专门的 ML 榜单,但是榜单上可以看到很多机器学习相关的项目。例如 Python 榜排行第 3 就是机器学习,该项目在总榜上也排行第 23 名。

作者表示,后续会在榜单项目上进行优化。期待能够实现 ML 榜单的那一刻。

入门GitHub中文项目榜单
12
相关数据
机器学习技术

机器学习是人工智能的一个分支,是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、计算复杂性理论等多门学科。机器学习理论主要是设计和分析一些让计算机可以自动“学习”的算法。因为学习算法中涉及了大量的统计学理论,机器学习与推断统计学联系尤为密切,也被称为统计学习理论。算法设计方面,机器学习理论关注可以实现的,行之有效的学习算法。

自然语言处理技术

自然语言处理(英语:natural language processing,缩写作 NLP)是人工智能和语言学领域的分支学科。此领域探讨如何处理及运用自然语言;自然语言认知则是指让电脑“懂”人类的语言。自然语言生成系统把计算机数据转化为自然语言。自然语言理解系统把自然语言转化为计算机程序更易于处理的形式。

推荐文章
暂无评论
暂无评论~