2020中国开源年度报告.pdf
2020 中国开源年度报告 前 撰写这篇前,我们的情直很复杂,很难某种词汇来概括。在升起的句话 是:“这是最好的时代,这是最坏的时代”。 也许多年以后,我们回看 2020 年,会将其称之为:世界剧变之始。很多朋友在去年,甚 “每天都在亲历历史,每天都是活久!”新冠疫情与中美贸易战,在同年加剧。因 为疫情和贸易战,世界正在加速发变化。 在这样的历史背景下,我们在开源界,也发现了以下三个趋势: 1. 开源发展以及由实向虚进发的趋势 从各种数据,以及我们的感觉都能发现:全球开源都出现个发展的趋势。GitHub 的 活跃代码仓库与活跃户数在速增(35.3% / 21.2%);Gitee的代码仓库与户数在以 更加惊的速度增(192% / 162%)。 ,是开源这么多年直持续的上升势头。另,则是我们的个猜测:疫情以 来,越来越多的开始远程办公,事实上促进了更多的有机会“斜杠化”,也就是在台电脑 前便地切换多种身份,以异步的式处理多种事务,从增加了开发者参与开源的时间和 机会。 当然,同样由于远程办公,虚拟世界在类活中的占,变得更了。这样是否更好,还会 引发哪些问题?作为站在隧道的类,其实是猜不透的。 2. 中国开源崛起以及开源世界分裂的趋势 随着越来越多中国开源项的影响不断增加、兰协议的推出、开放原基会的成, Gitee 的超速增,CODE China 的新发布,我们已经可以确信,2020 年是中国开源的崛 起之年。接下来阅读报告的朋友们,应该会看到很多确切的证据。 但是,另个值得注意的现象,也可以从下的数据看出来。在 GitHub 上最活跃的中国开 源项,与 Gitee 上最活跃的开源项之间,完全没有重叠。 随着 Gitee 的继续速发展,可以胆预测,今后会有越来越多的,质量的中国开源项 ,选择在 Gitee 上开源。曾经有位朋友提到的 “One World, Two Systems”,将会逐 渐变成现实。 如果中国的开源,以种与世界隔离的式 “崛起”,这并不是我们希望看到的未来。 3. 开源向善以及我们尚未做好准备 疫情爆发以来,众多的开源奉献的时间、精、技术和智慧,投到个个的抗疫相 关的开源项之中,也因此诞了诸多向医学、防疫、公益、救援的开源组织和开源项。 其中 wuhan2020 就是典型的代表。 因此,在 2020 年的中国开源年会筹办期间,我们毫不犹豫的选择了 “开源向善(Open Source for Good)”作为年会的主题,也获得了众多讲师、参会者与赞助商的致认同。 但是,接下来应该怎么发展呢?为了抗击疫情凝聚起来的,创造的项,积累的经验,总 结的教训,应该如何“整理、封装、模块化”,并为了今后的各种意外,做好准备呢?这些都是 值得期思考并改进的领域。 作为份图完整、客观、全、丰富的报告,值得探讨的问题当然不上述这些,也欢迎朋 友们阅读下的报告,并随时与我们交流。 庄表伟,开源社理事 2021 年 1 16 特邀点评专家: 吴晟,Apache 软件基会 Member,Apache Local Community 联合创始 东旭,PingCAP 联合创始兼 CTO 艳军,百度深度学习技术平台部级总监 蒋涛,CSDN 创始 & 董事,极客帮创投创始合伙 阳,SegmentFault 思否创始 & CEO 红薯,开源中国创始 & CTO 庄表伟,开源社理事 陈阳,开源社副理事 王伟,开源社执 刘天栋,开源社理事 、问卷篇 1、报告背景 2016 年初,开源社发布了2015 年中国开源社区参会调查报告,随后的年中,持续发 布了开发者调查报告,旨在从多种维度呈现国内的开源发展情况。今年我们再次启程,结合数 据分析段和调查报告等多种形式,绘制份 2020 年中国开源世界的地图。 这份问卷是每年中国开源年报的重要环,不基于调研的分析报告不过是纸上谈兵。在往年的 基础上,我们参考了其他现存的主流开发者问卷内容,并加了些新的视。基于 2020年 COVID-19这个不容忽视的背景,这份调查问卷进步将视发散到开源世界的线上协 作,以及开源能够为世界带来什么等主题。 通过近 60 项左右问题的统计调查与分析,我们希望能够还原出当前中国开源社区的真实现 状,从为开源的后来提供权威的参考。 调查对象:覆盖开发者、社区成员、贡献者、学、政府企业管理员 调查内容:主要涵盖个信息、作状况、开源社区以及开发者技术 调查法:以在线问卷式搜集样本和数据,交叉对法分析数据 推法:线上社交媒体、博客、开源社、开源中国站 问题数量:59 问题类型:单选、多选、开放性 样本量:236 2、重要发现 由于疫情,今年的问卷全部通过线上的式传播,因此收集到的样本量相往年较少,但仍旧 能够管中窥豹,观察到中国开源世界的悄然变化。通过分析 2020 年的统计数据,并对往年 数据和其它些公开发布的统计报告,我们有如下些重要发现: 开源参与者的主依旧是 20-39 岁群,相去年例仍在上升,在开源社区的年龄 分布中,20-30 岁群占据了 64%,说明开发者的年龄仍在趋于年轻化; 相较于 2019 年,今年参与调研的开发者中,还未作的群占了绝部分,从参与者从 事领域和职位分布也可以看出,这些“还未作”群多数指向学群体,这和当前社会普 遍追求更学历深造有关,和本次问卷传播形式有关,但是同时也能说明开源在教育领域 取得了不错的进展; 开发者所从事的技术向仍以前后端为主,其中后端开发占约 31%,其次是 Web 前 端、AI 以及数据分析向,占分别为10%、9%、9%,技术员以及其他业的 从业者占均为 7%,说明开源已经越来越受到社会各界的关注; 参与开源的形式由 2019 年以代码和测试为主转变为以代码和档为主,社区和项正在 意识到档的重要性,更多开源贡献者投到了档撰写中; 开源活动的参与频率相较往年有所上升,这与国内愈发繁荣的开源氛围和逐渐丰富的开源 活动也有关系。81% 的开发者认为开源活动对促进和推动开源社区关重要。对于更 倾向于线上还是线下的会议,结果竟惊地持平; 在 2020 年 COVID-19 这个背景下,各各业都不可避免受到了冲击和影响;82% 的 认为疫情对于参加开源社区的活动产了影响,但也具有推动作,11% 的认为毫 影响,7% 的认为疫情的负影响于正影响; 在在线档协作具的使上,墨档以的形式由第三名跃成为第名,压倒了 wiki 和 Google Doc,国内正在涌现出批优秀的协作具,并越来越为家认可; 2020 年 9 9 ,中国个开源软件基会开放原开源基会(OpenAtom Foundation)官正式对外发声,家对此抱有多重期望:推开源的理念,开源化 教育和社区建设,建开源态体系,对开源项进早期的孵化和扶持,帮助中国开源 社区进资源的整合和优化,并接轨国际开源社区。 3、开发者群体特征 3.1 参与者普遍年轻且学历较,男性占成 参与者的年龄集中在 20-39岁,受教育程度普遍在本科及以上,其中男性占约为 84%, 性为 16%,与去年持平。 【专家点评】 刘天栋:性参与开源的例这和过去23年的调查数据相似,但是和国际平均数据(约 1012%)相。期盼未来国内能有更多性参与开源,形成道美丽的开源景线。 陈阳:多元化一直是开源社区的口号,全球开源社区早在十几年前就开始发起了“鼓励女性参 与开源”的号召;开源社在每一年的中国开源年会 (COSCon) 上, 都有举办女性论坛的传 统。 2020 年的 COSCon 上, 我们邀请到了开源社区中的女性领袖,以她们独特能力和视角 将整个社区链接起来。GitHub COO Erica Brescia,管理着超过 5千万程序员的社区; Stormy Peters,从 GNOME 基金会执行总监,到现在负责着微软的开源办公室;来自亚洲 越南的 Hong Phuc Dang,从创办 FOSSASIA 开始参与开源,目前出任着 OSI 的董事会 VP。女性参与开源的广度和深度,正在按照我们所期望的方向发展,让这个世界变得有趣和 多元化。 3.2 从业时间及业领域 参与者中还未参加作的数最多,占约 36%,其次则是从业时间为 3-5 年、6-10 年的 参与者占分别为 19%、15%,从业时间在 10 年以上的约 2 成。 在参与者中,有近七成参与者从事互联开发/软件开发领域,其次则是教育/学术/科研领域 的参与者,占约 15%,融银、媒体告娱乐等领域也在积极参与开源。 3.3 职位分布 参与者中学和开发者占绝多数,相于 2019年,学占增加,约 37%,开发者 占约 36%。 3.4 所从事的技术向 参与者所从事的技术向以后端开发为主,占约 31%,其次是 Web 前端、AI 以及数据 分析向,占分别为10%、9%、9%,技术员以及其他业的从业者占均为 7%,说 明开源已经越来越受到社会各界的关注。 【专家点评】 陈阳:开源早期的时候, 开源 = Linux。 作为当时开源项的主战场,Linux 操作系统、 桌办公软件(GNOME, OpenOce)和浏览器(Mozilla)掀起了第波开源的浪 潮;近年来随着互联的兴起,开源的项和技术越来越百花放,从数据库到中间 件,从前端到后端,从编程语到编译器,从物联到微服务,从数据到智能, 开源的技术和项越来越丰富和多样化。 4、开源作现状 4.1 接触开源的时间 有近三成参与者接触开源的时间在 1-2 年,近成参与者接触开源时间在年以上。 【专家点评】 陈阳:开源社区员常稳定, 有种类似家庭的凝聚。 年前的开源圈, 活跃于 群早期的开源之间。我观察到身边的开源多数都是超过 10年以上的,并且未来 也会持续投开源。 2020 年数据显示有 3 成新参与者,从另外个度也印证了开源运动 在发展多年之后,呈现出种出圈的状态。 4.2 在开源中的时间投 约有 44% 的参与者每周在开源上的时间投不 5 时,每周对开源投时间在 5-20个 时的参与者约有 40%。 【专家点评】 吴晟:较低的职业开源开发者(周超过 20 时的贡献者)例,显示出中国企业对于开源 项,依然主要停留在户层。多数开源贡献者依然使业务时间或者作间隙进有限的 贡献和参与。 4.3 开源活动 绝多数参与者每年只会参加次线上/线下的开源活动,每个参加到两次线上/线下开源 活动的参与者占约两成。线下的开源活动多以沙、讲座等为主,线上的开源活动以在线 会议、邮件列表讨论、PR 活动等为主。 81% 的参与者认为开源活动对促进和推动开源社区关重要。 【专家点评】 阳:我们励开发者积极参与到开源活动中来,尤其励家积极参与线下活动。线下的 、沟通有助于建起与之间的信任,对于社区的繁荣、与之间更效的协作有重要 意义。 关于开展线上还是线下的开源活动/会议,参与者们各抒,线下活动可以对地沟通交 流,交流更有效率,氛围更好,可以有更多出去看看,结交新朋友的机会,线上活动则更 加安全、便捷,不受时间、地域等限制,成本低廉,且会议内容可以录像,便会后复查,当 然,线下录像也是越来越普遍。 2020 年是分特殊的年,COVID-19 这场世界性的疫情给各各业都带来了不同程度的冲 击,82% 的参与者认为,疫情对于参加开源社区的活动产了影响,但也具有推动作。 【专家点评】 刘天栋:新冠疫情的冲击,加速了更多远程上班的族群参与了开源活动。以开源社在 2020年 1024-25举办的 第五届中国开源年会 + Apache 中国路演 为例,有超过百万次在线 参与,这是过去线下活动参与数的千倍的成,同时也有往年更多的国际与国内的开源 咖在线分享。虽然这次会也同步在五个城市举办了线下聚会,但是我们可以预期未来线上会 议将成为常态。 4.4 开源收 可以看到,很多参与开源并不追求物质回报,有三成参与者没有开源收,但依然热衷于开 源作,同时,我们还可以注意到有 12% 的参与者表示企业会付资持员全职/部分 参与开源,有 23% 的参与者表示学校科研项或社团投有在持参与开源,可现在 企业和学校都开始逐渐关注并重视开源。 【专家点评】 吴晟:能够获得开源收例和开源参与时间超过 20 时的例度致,很好的显示出商 业价值在开源贡献强度上的显著变化。虽然,贡献时间和收并不代表开源贡献和开源项的 质量,但质量的项需要定的商业持才能得到良性循环。 陈阳:有12%的参与者从开源中获得兼职或全职收, 开源布道师, 开源运营经理, 开源 开发者等都是2020年的热职业,这说明开源的态正在进步完善, 企业开始进开源 才储备,开源的商业逻辑正在明晰。 4.5 远程办公 远程办公是当下常重要的种办公式,在参与者中,有成认为远程办公是重要的,并且 有接近九成的参与者有过远程办公的经历。 【专家点评】 阳:远程办公会变成种常态化的办公和协作式融到我们的作和活中,开源运动和 分布式、远程协同本来就是天然融合的。 4.6 第次接触的开源产品 有 32% 的参与者第次接触的开源产品为互联产品,紧随其后的便是操作系统相关的产品 与开发具,调查结果与以往基本致,说明互联产品和操作系统相关产品仍然是家了解 和接触开源的最初窗。 4.7 最希望能够开源的产品 相于 2019 年,开发具在今年成为家最希望能够开源的产品类型第名,紧接着的是操 作系统,数据库产品与中间件产品也是很多希望能够开源的产品类型。 4.8 企业对开源的贡献 在参与者眼中,GitHub 对于开源软件的贡献最,其次是 Google,在国内企业中, Alibaba、Huawei 和 Baidu 分别占据前三名。 4.9 机器流程动化 对于开源项是否继承了 RPA,即机器流程动化具,有四成参与者表示部分项集 成了 RPA,16% 的参与者表示乎所有项都有集成 RPA,同时也有 24% 的参与者表示从 来没有在开源项中集成过 RPA。 5、开源社区参与现状 5.1 开源最吸引你的因素 开放透明的代码和知识共享,以及开源的精神理念成为开源最吸引参与者的因素,软件的购 买成本却并不是主要的因素。 5.2 最喜欢的开源产品是什么 Linux 以巨优势,成为参与者最喜爱的开源产品,MySQL 紧随其后,Apache 和容器界的 Docker 分别位列第三、第四。 5.3 具体参与的社区作 绝多数参与者在社区都参与代码或档撰写的作,测试、本地化以及活动组织也是很多 在社区会参与的作。 5.4 最看好的开源产品 开源产品的前景展望中,互联产品以 34% 的例成为参与者最看好的开源产品发展向。 智能和开发具异军突起,成为现在开源产品中的和热点。 5.5 开源社区的交流式 在社区的交流式中,微信和邮件列表前最为普遍,QQ 也是国内重要的即时交流具。新 锐的交流具例上升:Slack 和 Zoom 也是值得关注的现象。 【专家点评】 吴晟:微信、QQ 群的强度使,仍然显示出开源圈缺少国际化社交和协作能的贯性 短板。同样反映出中依然是绝部分的开源参与者唯热衷的交流式。 5.6 社区与代码的关系 有近九成的参与者认为在开源社区中,社区的价值于或等同于代码,因为围绕代码的社 区,会让代码变得更加优秀。 【专家点评】 阳:很兴看到家对于社区价值的认同,在我们看来,个健康的社区远优秀的代码更 重要,只有健康、多样和友好的社区才能推动项可持续发展,正如句话说的“个的 很快,群得很远”。 5.7 开源社区年龄分布 开源社区中,20-30 岁的贡献者是主要组成部分,占超过六成。 【专家点评】 吴晟:开源参与者中年轻研发者较多,反映了中国对于开源的参与时间较晚,学做为 可塑性较的群体,更容易跟随最近的开源热度,选择参与到开源。缺少 35-40 岁以上的开 发者,正反应了中国资深程师的缺乏。缘起中国的开源项的规模崛起,将分依赖此 部分的例提升。 5.8 开源软件安全 有近七成的参与者表示不会有不安全感,但同时也仍有 25% 的参与者表示会有此类担忧,开 源软件的安全问题仍然值得我们关注。 【专家点评】 红薯:开源软件由于其机制的关系,通过开源社区不断地发现问题并维护,其安全问题可能并 不是开发者们的主要关注点。其实除了技术的安全问题,开源合规性等许可证的安全 问题同样需要开发者们重视,许可证冲突问题所带来的法律险影响常且很难被发现,尤 其是对于企业来说,检查所使的开源软件合规性,其重要性不亚于其技术安全。 5.9 中国成开源基会的作 参与者们致认为中国成开源基会是常有意义的,可以推开源的理念,开源化教 育,社区建设,建开源态体系,利于开源项早起的孵化和扶持,帮助中国开源社区进 资源的整合和优化,也有助于接轨国际开源社区。 【专家点评】 蒋涛:在全球科技竞争和中国开源核心技术发展态势下,从开源生态制高点着眼,建设和发展 中国开源基金会意义重大。通过中国开源基金会的发展壮大,不断鼓励国内巨头科技企业和社 会力量合力共建开源创新生态环境;同时,通过学习借鉴更完善的基金会运行模式、组织机制 和法律制度,建设可持续发展的中国开源创新力量。此外,在当前全球开源商业模式越来越成 熟的市场环境下,建设开源基金会,还可以引导国内外基金和投资机构孵化支持开源,培育中 国开源独角兽,最终形成资本、企业、开发人员为主体、共享共惠的中国开源商业生态体 系。 阳:2020 年中国个开源基会开放原世,这对于在本推动开源教育的普及以及开 源态的整体繁荣有重要意义。我们期待看到开放原可以成为开源的连接器,连接国际开源 社区、链接国内外优质资源,帮助开源项成与成功。 6、开发者技术现状 6.1 开发语 开发语呈现多超多强的状态,前三甲分别为 Java、JavaScript 和 Python,排名与去年基 本保持致。 【专家点评】 王伟:编程语是家喜闻乐的话题,排名没有太的变化。值得提的是 SQL 语 ,这个平时存在感貌似不是很强,但实性却常强。实际上,本报告中的 GitHub 数据篇 中的基础数据全部都是 SQL 跑出来的,是项开发者必备的重要基础技能。 6.2 在线档协作编辑具 在线档编辑具中,墨档是前中国开源社区经常使的具,wiki 也依然是常多参 与者使的协作具。 6.3 编辑器 VS Code 今年仍然是最受欢迎的编辑器,紧随其后的是 vim 以及 notepad+。 6.4 版本控制具 毫疑问的是,Git 枝独秀,具有绝对性优势。SVN、TFS、CVS 前仍有不少参与 者在使。 6.5 数据库 数据库使情况中,不出意外地,MySQL 以绝对优势遥遥领先,MongoDB 与 PostgreSQL 跟随其后。 6.6 操作系统 操作系统的使中,Windows、Linux、MacOS X 三分天下。 6.6 会议具 腾讯会议是前参与者们使最多的会议具,其次则是 Zoom、钉钉。 6.7 聊天运维具 前,绝多数的参与者都没有使过聊天运维具来进项的动化管理,对于使过 该类具的参与者来说,Hubot 是他们使最多的 ChatOps 具。 6.8 开源平台 如果要开源的项,87% 参与者都表示将会在 GitHub 来开源的项,其次则是 Gitee 和 Gitlab。 【专家点评】 蒋涛:随着开源规模和商业化的快速发展,开源平台作为开源项目和开发者生态的重要基础及 支撑体系,未来将承载更多的服务和应用场景,也将发展出各自特色。2020 年新发布的 CODE China,作为独立第三方开源平台,将重点围绕 AIOT,为更多开源项目和开发者提供 运营支持和生态服务。 6.9 技术论坛 知乎和 CSDN 前是最受参与者们睐的两个技术论坛,其次则是 StackOverow,开源中 国与博客园也受到很多参与者的喜爱。 7、总结 & 致谢 本次问卷在传播和收集过程中多有坎坷,最终呈现的不过是开源世界的隅,但意义重 。微知著,不难察觉到中国的开源结构已经在发变化,开源的星星之正在燎原,势不 可当。希望这份报告能够抛砖引,吸引更多的社区和开发者加。 该报告的问卷问题, 报告档均发布在代码托管平台,开源社官站和合作伙伴站平 台,基于 Creative Commons Attribution-ShareAlike 4.0 International (CC BY-SA 4.0) 许 可证协议分享。对于问卷的问题设计和报告内容有任何建议和想法,欢迎您在代码托管平台上 提交 Patch, 对报告进补充和贡献。 您的步,整个中国开源社区的步。 此报告问卷篇作出贡献的开源社中国开源年度报告组成员:夏雅,宁泽欣;社区合作伙 伴:X-lab,Gitee,微软 Reactor。感谢特邀的开源领域的专家,更要特别感谢积极参与我们 调研的每位朋友。 、GitHub 数据篇 1、概述 1.1 背景 本部分内容采 GitHub 全域事件志进统计分析(2020 年共计 8.74亿条),相较 2019 年的 5.46 亿条增约 60%。并对分析出的部分项进标注,挑选出中国的个开发 者和企业组织,同时构建了科学合理的数学模型进分析。 在开发者活跃度与项活跃度的定义下,本次统计得到 2020 年总活跃项数量约 5,373万 个,相较 2019 年的约 3,972 万 增约 35.3%;2020 年 GitHub 总开发者数为 5,600多 万,总活跃开发者数量 约 1,446万,相较 2019 年的约 1,19 万 增加了约 21.2%。 1.2 指标解释 2、主要内容与发现 2.1 世界开源 Top10 项 活跃度最的项是来歌的前端跨平台开发框架 utter/utter,此外,源于歌的深度 学习框架 tensorow/tensorow,容器编排系统 kubernetes/kubernetes 也分别位于第 5 名和第 6 名,这说明了歌在开源上的努和影响获得了业内的认可。 微软的跨平台代码编辑器 microsoft/vscode 和微软使开源的式来建设其 Azure 云平台 的项 MicrosoftDocs/azure-docs 分别位于第名和第三名,表明微软在开源上的努获 得了程序员的认可。 microsoft/vscode 和 DenitelyTyped/DenitelyTyped 均使 TypeScript 作为主要的编程 语,这可能与 TypeScript 的受欢迎程度急剧攀升有关。 指标名称 含义 language 项开发使的主要语 activity 项活跃度(通过加权计算得到) developer_count 在活跃度定义下参与该项的开发者数 issue_comment 项所有 Issue 和 PR 在 2020 年获得的评论总数 open_issue 项 2020 年新增的 issue 数量 open_pull 项 2020 年新增的 PR(pull request)数量 pull_review_comment 项 2020 年所有 PR 下的 Review 评论数 merge_pull 项 2020 年被合并的 PR 数量 pull_commits 项通过 PR 合的 commit 数量 pull_additions 项通过 PR 合增加的代码数 pull_deletions 项通过 PR 合删除的代码数 2.2 中国开源 Top 50 项 Top50 列表中,从项活跃度来看,第 1 名与第 50 名的项活跃度相差超过 10 倍,说明 中国开源项之间的差距较。 从这个列表中,我们发现,阿在开源领域中的成绩显著。Top10 项中上榜的项有 4 个,除了蚂蚁服采 React 封装的套组件库 ant-design/ant-design,基于 Ant Design 框架搭建的中后台管理控制台的脚架 ant-design/ant-design-pro 和致于配置和管理微 服务的特性集 alibaba/nacos 外,饿了么(已被阿收购)的开源项 ElmFE/element 作为 前端组件,表现也分突出。 PingCAP 在开源领域的表现也是常地亮眼。Top50 项中上榜的项有 6 个,包括由其 主设计、研发的开源分布式关系型数据库 pingcap/tidb,分布式事务型的键值数据库 tikv/tikv,档项 pingcap/docs-cn、pingcap/docs 等,表明 PingCAP 很重视项档 的建设。值得关注的项是 pingcap/tidb,该项的issue_comment,open_issue, pull_review_comment,merge_pull 等属性是 50 个项中最的,达到惊的 52,871 和 10,981,相对之下,issue_comment 属性下排名第的 ant-design/ant-design 只有它 的 61.5% 左右。其 480 的开发者参与数量,与其他前端项相较甚远,但却有着如此的 活跃度,也可以看出其社区的活跃程度。 百度在智能领域的表现常不错,其深度学习平台 PaddlePaddle 占据了 6 个项,分 别是核框架 Paddle 以及相关具库、扩展版本和模型库 Models;此外开放动驾驶平台 ApolloAuto/apollo 也榜上有名。 中国的 Top50 项列表中,包括阿的 Ant-Design 组件库,京东基于 React 前端框架的 开发框架 taro,由饿了么(已被阿收购)前端团队开源的 Vue UI 组件库 Element 等等, 这说明在国内,前端群体在开源社区更为活跃;另外前端代码般也不太涉密,因此公司在 态上更开放些。不过这其中也有点需要引起注意,上榜的前端项组件库居多,但是缺少 核项。 属于智能领域的项 PaddlePaddle/Paddle、apache/incubator-tvm、 Tencent/ncnn、alibaba/MNN 均在中国 Top50 项列表中占据席之地,这说明了国内各 公司都在发展智能领域。 2.3 中国开源企业情况分析 各开源项的背后,基本都有科技公司的持,我们计算出了科技公司所维护的开源项在 2020 年的活跃情况,结果如下表所示: 在国内企业的开源数据中,我们看到阿巴巴在除 pull_review_comment 指标外之外各项指 标得分均排名第,单项得分上,Repo_count 和 Developer_count 是其他公司之和, Open_issue 的数量也其他公司出了个数量级。 AI 是百度开源最鲜明的竞争,如国内开源开放的深度学习平台 PaddlePaddle 和动驾 驶平台 Apollo。腾讯 Tencent 在 GitHub 上发布的 192 个 repo,项范围主要聚集在云原 、数据、AI、移动开发和 Web 开发五个技术领域。华为在开源领域的投有共睹,但 从 GitHub 上的数据未能充分展现其实,中美宏观贸易战的影响在此略斑。WeBank 微 众银作为新兴的互联融公司,已开源 27 个项,44 个 repo,覆盖智能、区块 链、云计算和数据等领域,也是公司早期就建开源办公室的融公司。滴滴开源势头很 猛,成开源委员会,不仅积极参与业界开源项,还在 GitHub 上积极开放出 38 个 repo。Deepin 的桌环境 DDE 受到国内外户喜爱,软件态除了研还在其应商店中收 录了上千款桌应,作为国内间出品的 Linux 操作系统,还是可圈可点的。 PingCAP 在 2020 年下半年宣布完成 2.7 亿美元的 D 轮融资,创造了全球数据库历史新的 程碑,同样,PingCAP 今天在开源的表现也是常亮眼,已经超越百度跃居排榜第 位。其中,pull_review_comment 的数量更是超过了阿,但开发者的数量却不阿的 1/10,可 PingCAP 的开源社区常的活跃。 有赞的排名上升得常快,这可能得益于其开源项 youzan/vant 的优秀表现,该项是轻 量级的移动 UI 组件。 值得注意的是 Bilibili、douban 和掘等以户产内容(User Generate Content)为主的 新兴社交媒体企业也在积极使开源技术。 可以看出,中国开源领军企业近年来均在不断加开源社区态的投和建设,互联、操作 系统、社交站、融、云计算和电商等各个领域的企业都积极参与,呈现出百花放的开源 盛况。 2.4 Apache 软件基会之源中国的开源项 Apache 软件基会(ASF)成于 1999 年,基会致于帮助独个体和组织去理解开源 是如何在个激烈竞争的市场中发挥优势的。其重点不是产软件,是指导产软件的社 区。Apache 之道对于开源社区的持久发展具有显著的优势:我们维护的切都是开源的,所 有的户都可以从中受益。Apache 前有 14 个源于中国的顶级项,还有 7 个孵化器项 正在努成为顶级项。 2020 年,Apache 软件基会源中国地区活跃的开源项共有 21 个,其中,有 9 个项 围中国开源项排榜 Top50。 Apache 软件基会下属的中国开源项中,最活跃的项是 apache/shardingsphere, Apache ShardingSphere 是套开源的分布式数据库中间件解决案组成的态圈,它由 JDBC、Proxy 和 Sidecar(规划中)这 3 款产品组成,该项已于 2020 年 4 16 成为 Apache 基会的顶级项。 apache/incubator-echarts 和 apache/skywalking 的表现也常活跃,分别居中国开源排 榜第 10、12 名。Apache ECharts 是个免费的,功能强的图表和可视化库;SkyWalking 是个观测平台和 APM 具,它可以选择性的与 Service Mesh 协同作,为微服务、云原 和基于容器的应提供动的指标,前为阿、华为、腾讯等国内提供监测服务。 ECharts 和 SkyWalking 同样也是 Apach 软件基会的顶级项。 从这些数据,我们看到,Apache 作为世界上最活跃的基会之,对中国开源社区的贡献是 巨的。,Apache 作为顶级基会,其优秀的开源项和和谐的社区氛围吸引着越来 越多的中国开源项加其中;另,越来越多中国开源项的参与也为 Apache 社区中 加了越来越多的中国彩,期待中国开源项早冲世界开源项 Top10! 【专家点评】 陈阳: 从时间这个维度,我们看到中国开源从早期的跟随者、参与者,逐渐变成影响者和创 作者, 中国开源的量正在崛起。中国开始涌现出量开源项的创作者,中国企业的开源 项开始捐献给基会孵化,中国开始定义的开源许可证协议(兰宽松协议)并被 OSI 接受,中国开始成中国的开源基会(开放原基会),这些都是中国开源开始成熟的很 重要的标志。 刘天栋:2015 年开源社与 ASF 联合举办 Apache 中国路演 ,当时在 ASF ,源中国的 开源项只有 3个(Ebay 中国研究院的 Kylin、Eagle、Grin),在 6 年时间内,就成 到了 21个(其中由 ASF 孵化器毕业成为顶级项达到了 14个)。筚路蓝缕,酸甜苦辣点滴 在头。中国、贡献全球的愿景正在路途中! 2.5 中国顶级开源项访 艳军(百度深度学习技术平台部级总监,PaddlePaddle/Paddle) 很兴看到 PaddlePaddle(桨)在 2020 年延续了 2019 年在中国活跃项排榜上度 活跃。 深度学习框架是智能开源态的核,技术复杂度常,同时需要结合应慢持续 打磨。桨作为我国最早开源、功能最为完备的深度学习平台,直秉持开放透明的理念进 开源开发。桨结合 AI 产业发展需要,在框架整体设计以及全流程开发具保持了前瞻 性整体设计,保持对程质量的极致追求,并通过社区机制进质量的有效保障,凭借项质 量在 AI 开发者中形成了良好的碑。 桨直常关注开发者对社区的贡献和认同感。桨前除了已经有 5,000 多位开源开发 者通过 PR 或者提 issue 的式做贡献之外,还励更多开发者通过攻略、社群交流等其他 式参与贡献。所有开发者在使过程中的问题都会得到社区的快速响应,也都纳到新版本的 发布中来,通过这样持续闭环的打磨,项质量得到保障和持续提升,更好地满 AI 开 发者的使需求,也让开发者形成了更强的社区认同感。 深度学习框架在 AI 技术栈中处于承上启下的位置,向下对接芯,向上承接应,与芯 泛适配、深度融合优化关重要。因此桨跟硬件商建了紧密合作关系,很多芯商直 接在桨社区贡献代码,为桨态发展做了量贡献。桨也持续与各开源组织、AI 社 区深度合作,并得到启智(OpenI)社区的持成为其中重要员。通过 PaddlePaddle Developer Experts(PPDE)、SIG 等组织形式,推动与开发者的深交流互动,与社区开发 者共同成。 吴晟 (Apache/skywalking) Apache SkyWalking 今年呈现爆发式的发展,语探针覆盖了所有主流编程语, Java、Core、Golang、PHP、NodeJS、Python、C+、LUA for Nginx全铺开。Star 数量、贡献者数量、PR 数量等常社区活跃度指标,都相 2019 年翻了倍。 SkyWalking 户家覆盖国内乎所有的,正在形成的标准体系。各云商,阿 云和腾讯云的云 APM 服务都全持 SkyWalking 传输协议。同时,SkyWalking 也完成 了和 OpenTelemetry、Prometheus、OpenCensus 等主要监控态的缝对接。 今年的 SkyWalking 社区和暑期 2020 活动的合作分成功,孵化了 2 位在线研究成为正 式 Committer。活动中这两位学的表现,展现了学团体在顶级项中的潜。这是相对 于 2019 年,全新的貌。也展现了系统性的学孵化计划的价值和意义。希望在今后,我们 能看到包括已经发布的暑期 2021 之外,更多更好的学定向孵化和合作计划。 在全球化的过程中,在 Apache 商中的框架下,SkyWalking 项在跨地域、跨时区异步 多元化的协作模式中顺利前。SkyWalking 项已经成为多家国内外公司(亚洲、欧洲、北 美)的商业化项的核组件,更多的职业开发者加了项。为项态带来了巨的活性 和迭代速度。SkyWalking 在按照的节奏,和国内外的商业化商、个开发者、公司 次开发团队起,迅速地成熟和壮。 东旭(PingCAP CTO,pingcap/tidb,tikv/tikv) TiDB 今年社区运营的重点可以分为:户、开发者两块。从业务度来看,可以分为项打 磨和完善,才的培养和态建设,户场景的挖掘和业务成功推进。所以,运营个好的开 源社区,最重要的是以为中,与他们共同成。 对于 TiDB 社区来说,过去的年发展还算迅速,去年 TiDB 4.0 版本正式推出了 TiFlash 列 式引擎。在 Real-time HTAP 的道路上迈出了坚实的步。从我们的数据上来看,接近 1/3 的 4.0 集群上了 TiFlash。说明直接在 TP 的数据上作实时的数据洞察是普遍的需求。 其中可以感受到国内的开源氛围及开发者的活跃度也在逐步提升,我们从 2019 年底的 500+ contributor 到 2020 年底数字已经达到了 1,200+,家对于开源项的参与度与理解也越 来越深,越来越多的开发者在 TiDB 社区汇聚,通过 TiDB 连接业上下游,共享创新成果。 从 TiDB 的运营度来看,开源社区的繁荣先有些基本的原则:透明、公开、分享等等, 举个例:我们的所有讨论的档、发展向、投票、选举这些都是公开的、透明的,所有社 区的贡献者都可以参与进来;其次,我们也制定了些基础的社区治理的规则、架构,在基础 设施也做了些动化的 Bot 服务,帮助更多的开发者在社区获得更好的体验和感受; 最后再通过些公开透明的激励和反馈,吸引更多的开发者能够积极地参与进来。 3、案例分析ASF 3.1 简介 Apache 软件基会(ASF)成于 1999 年,是个依据 501(c)(3) 在美国成的营利性 公共慈善组织。基会致于: 提供基础设施:为开源项提供硬件,沟通交流以及项治理等的基础设施; 提供于捐赠的法律实体:建个独的法实体,公司和个可以向其捐赠资源,并 确保这些资源将于公共利益; 提供法律保护框架:为个志愿者提供法律保