Github年度报告:2023 年开源状况和人工智能的崛起

1,011 阅读18分钟

本文为原创翻译 原文地址 [github.blog](autolinkhttps://github.blog/2023-11-08-the-state-of-open-source-and-ai/#take-this-with-youautolink)

在今年的 Octoverse 报告中, GitHub 研究了围绕人工智能、云和 Git 的开源活动......

新技术成为主流意味着什么?

Git于2005年首次发布,当时它作为一个新的开源版本控制系统,还比较新鲜。如今,Git已经成为现代开发者体验的基石——有93%的开发者使用它来构建和部署各地的软件。

2023年,GitHub的数据凸显出另一项技术如何迅速开始重塑开发者体验:人工智能。过去一年中,越来越多的开发者开始使用人工智能,同时也在尝试构建人工智能驱动的应用程序。Git从根本上改变了现代的开发者体验,而现在人工智能正在为软件开发的下一步发展奠定基础。

在GitHub,我们了解开发者喜欢边做边学,开源可以帮助开发者更快地采用新技术,将其集成到工作流程中,并构建下一代技术。开源还为几乎所有现代软件提供动力,包括大部分数字经济。在GitHub探索技术如何成为主流的过程中,它在弥合开源技术实验与广泛采用之间的差距方面发挥着关键作用,这些技术支撑着GitHub软件生态系统的基础。

在今年的报告中,GitHub将研究围绕人工智能、云计算和Git的开源活动如何改变开发者体验,并日益增强其对开发者和组织的影响。

GitHub 发现的三大趋势:

开发者正在大量使用生成式人工智能进行构建。 GitHub看到越来越多的开发者在试验使用OpenAI和其他人工智能参与者的基础模型,开源生成式人工智能项目甚至进入了2023年按贡献者数量计算的前10大最受欢迎开源项目。几乎所有开发者(92%)都在使用或尝试人工智能编码工具,GitHub期待开源开发者能在GitHub上推动人工智能创新进入下一个阶段。

开发者正在大规模运营 云原生 应用程序。 GitHub看到使用基于Git的基础设施即代码(IaC)工作流的声明语言有所增加,云部署标准化程度更高,开发者使用Dockerfile、容器、IaC和其他云原生技术的速度显著提升。

2023年首次开源贡献者数量最多。 GitHub继续看到商业支持的开源项目在吸引首次贡献者和总体贡献量上占据最大份额,但今年,GitHub还看到生成式人工智能项目进入了首次贡献者最受欢迎的前10个项目。

💡 看下图👇

在全球范围内,开发者正在使用 GitHub 来构建软件并进行比以往更多的协作,而且涉及公共和私人项目。这不仅证明了 Git 在当今开发者体验中的基础价值,也展示了全球开发者社区使用 GitHub 构建软件的情况。

image.png

美国拥有 2020 万开发者,过去一年开发者增长 21%,继续占据全球最大的开发者社区。

但自 2013 年以来, GitHub 不断看到其他社区在整个平台上实现了更多增长, GitHub 预计这种情况会持续下去。GitHub 上开发者的全球分布显示了哪些地区拥有最多的开发者。

亚太地区 、非洲、南美洲和欧洲的开发者社区逐年扩大,其中印度、巴西和日本处于领先地位。

预测未来五年排名前 10 的开发者社区[](#projecting-the-top-10-developer-communities-over-the-next-five-years)

为了了解哪些开发者社区将在未来五年内增长最快, GitHub 根据当前的增长率进行了预测。在此标题下, GitHub 预计到 2027 年印度将取代美国成为 GitHub 上最大的开发者社区。

这些预测假设线性增长,以预测到> 2028 年哪些开发者社区将成为 GitHub 上最大的社区。

image.png

亚太地区发展最快的开发者社区

GitHub 继续看到,在印度、日本和新加坡等经济中心的推动下,亚太地区出现了可观的增长。

开发者数量同比增长
01 新加坡>100 万开发者39%
02 印度>1320 万开发者36%
03 香港(特别行政区)>160 万开发者35%
04 越南>150 万开发者34%
05 印度尼西亚>290 万开发者31%
06 日本>280 万开发者31%
07 菲律宾>130 万开发者31%
08 泰国>857K 开发者25%
09 韩国>190 万开发者22%
10 澳大利亚>140 万开发者21%

表 1:2023 年开发商总数增长,较 2022 年增长百分比。

印度的开发者社区持续增长。

在去年的Octoverse中,我们预测印度的开发者总数将超过美国。这仍有可能发生。印度的开发者人数同比增长36%,2023年有350万新开发者加入GitHub。

新加坡今年是亚太地区开发者人数增长最快的国家,并且以开发者占总人口的比例最高而位居全球第一。

新加坡国立大学计算机学院将GitHub纳入其课程,高增长也很是这个原因

由于对技术和初创公司的投资, 还可能在明年看到日本的开发者持续增长

非洲发展最快的开发者社区

非洲地区拥有世界上增长最快的人口和不断增加的开发者,已被认为是有前途的科技公司中心。(例如,在肯尼亚,小学和中学必须教授编程。)

开发者数量同比增长
01 尼日利亚>868K 开发者45%
02 加纳>152K 开发者41%
03 肯尼亚>29.6 万名开发者41%
04 摩洛哥>446K 开发者35%
05 埃塞俄比亚>94K 开发者32%
06 南非>539K 开发者30%

表 2:2023 年开发商总数增长,较 2022 年增长百分比。

尼日利亚是 OSS 采用和技术投资的热点,其 45% 的同比增长率(**全球增幅最高)**反映了这一点。GitHub 上还有至少 200 个由尼日利亚开发者制作的项目集合,可以在“ 非洲制造”集合下找到。

南美洲发展最快的开发者社区

南美洲的开发者增长率与亚太和非洲一些增长最快的开发者社区持平。

开发者数量同比增长
01 阿根廷>925K 开发者33%
02 玻利维亚>105K 开发者33%
03 哥伦比亚>872K 开发者31%
04 巴西>430 万开发者30%
05 智利>437K 开发者26%

表 3:2023 年开发商总数增长,较 2022 年增长百分比。

2023 年,巴西的开发者人数是该地区最多的,并继续以两位数增长,同比增长 30%。此前,巴西的私人和公共组织持续投资查看巴西开发者在 GitHub 上创建和贡献的OSS 项目列表。

GitHub 还看到阿根廷和哥伦比亚的持续增长,这两个国家在过去几年中已成为组织的热门投资目标。

欧洲发展最快的开发者社区

整个欧洲的社区开发者总数继续增加,但他们的发展现在更接近于美国的总体发展,因为南美洲、非洲和亚太地区的社区增长超过了他们。

开发者数量同比增长
01 西班牙>150 万开发者25%
02 葡萄牙>41 万开发者24%
03 波兰>120 万开发者24%
04 德国>290 万开发者22%
05 意大利>110 万开发者22%
06 法国>230 万开发者22%
07 英国>340 万开发者21%

表 4:2023 年开发商总数增长,较 2022 年增长百分比。

**值得注意的是,法国的增长是在政府推动吸引更多科技初创企业之后实现的。

GitHub 还看到西班牙和意大利的增长有所上升,这说明这两个地区为支持其国内技术市场所做的努力。

2023 年生成式 AI 爆发式增长

虽然生成式人工智能在2023年引起了轰动,但对于GitHub上的开发者来说,它并不是完全新的。事实上,过去几年在GitHub上已经出现了几个生成式人工智能项目,以及许多其他专注于人工智能的项目。

但是2023年的GitHub数据反映,这些人工智能项目已经从更专业导向的工作和研究,发展到了更主流的采用,开发者们越来越多地使用预训练模型和API来构建人工智能驱动的生成应用程序。

就在去年过半的时候, GitHub 看到2023年的生成式人工智能项目数量是2022年全年的两倍多。 GitHub知道这只是冰山一角。

随着越来越多的开发者尝试这些新技术,GitHub期待他们能推动软件开发中的人工智能创新,并继续将这项技术快速发展的功能带入主流。

开发者越来越多地尝试人工智能模型。 在过去的几年里, GitHub 看到开发者使用[tensorflow] 、[pytorch/pytorch]等机器学习库构建项目,而现在> GitHub 看到更多的开发者尝试使用 AI 模型和 LLM(例如[ChatGPT API]。

保持灵活性: GitHub 预计企业和组织也将利用预先训练的人工智能模型,特别是随着越来越多的开发者熟悉如何使用它们进行构建。

开源人工智能创新多种多样,顶级人工智能项目由个人开发者拥有。 在GitHub上排名前20的开源生成式人工智能项目中,一些顶级项目是由个人开发者拥有的。这说明GitHub上的开源项目继续推动创新,并向所有人展示这个行业的未来发展方向,社区是围绕最令人兴奋的进步进行建设的。

生成式人工智能正在极大地推动全球对生成式人工智能项目的个人贡献,同比增长148% ,生成式人工智能项目的总数也同比增长了248%。值得注意的是,在开发者社区中,美国、印度和日本处于领先地位,香港特别行政区、英国和巴西则紧随其后。

💡 学习生成式人工智能的开发者数量的大幅增加将会对企业产生影响。 随着越来越多的开发者熟悉构建基于人工智能的生成式应用程序,GitHub预计不断增长的人才库将会支持那些寻求开发自己的基于人工智能产品和服务的企业。

总结:在过去的一年里,GitHub看到构建在基础模型(如ChatGPT)之上的应用程序呈现出指数级增长,因为开发者使用这些大型语言模型来开发面向用户的工具,如API、机器人、助手、移动应用和插件。全球的开发者正在帮助主流采用奠定基础,而实验也在帮助组织建立人才库。

最流行的编程语言

自从 GitHub 在 2019 年看到 云原生 开发的巨大增长以来, IaC 在开源领域也持续增长。2023 年,Shell 和 Hashicorp 配置语言 (HCL) 再次成为开源项目中的顶级语言,这表明运维和 IaC 工作在开源领域越来越受到重视。

  • HCL 采用率同比增长 36%,这表明开发者正在为其应用程序利用基础设施。

  • HCL 的增加表明开发者越来越多地使用声明性语言来指示他们如何利用云部署。

JavaScript 再次夺得第一大最受欢迎语言的桂冠,并且 GitHub 继续看到 Python 和 Java 等熟悉的语言逐年保持在前五名语言之列。

TypeScript 越来越受欢迎。 今年,TypeScript 首次取代 Java,成为 GitHub 上 OSS 项目中第三大最受欢迎的语言,其用户群增长了 37%。TypeScript 是一种集语言、类型检查器、编译器和语言服务于一体的语言,它于 2012 年推出,标志着渐进类型的到来,它允许开发者在代码中采用不同级别的静态和动态类型。

用于数据分析和操作的流行语言和框架显着增加。T-SQL 和 TeX 等古老语言在 2023 年不断发展,这凸显了数据科学家、数学家和分析师如何越来越多地使用开源平台和工具。

编程语言不再仅仅局限于传统软件开发领域。

与 GitHub 上使用的总体最流行语言相比, GitHub 发现 2023 年创建的项目中使用的最流行语言具有显着的一致性。一些值得注意的异常值包括 Kotlin、Rust、Go 和 Lua,它们在 GitHub 上的新项目中出现了更大的增长。

Rust 和 Lua 都以其内存安全性和效率而闻名,并且都可以用于系统和嵌入式系统编程,这可以归因于它们的增长。Go 最近的增长是由 Kubernetes 和 Prometheus 等云原生项目推动的。

开发者活动是新技术采用的领头羊

2023 年初, GitHub 庆祝了[超过 1 亿开发者使用 GitHub]的里程碑——自去年以来,看到 GitHub 上的全球开发者帐户数量增长了近 26%。更多的开发者跨时区协作并构建软件。私人和公共存储库中的开发者活动强调了哪些技术正在被广泛采用,以及哪些技术有望得到更广泛的采用。

开发者正在自动化更多的工作流程。 在过去的一年里,开发者使用 GitHub Actions 分钟数增加了 169%,用于自动化公共项目中的任务、开发 CI/CD 管道等。

  • 平均而言,开发者在公共项目中每天使用 GitHub Actions 的时间超过 2000 万分钟。随着 GitHub Marketplace 中的 GitHub Actions 数量在2023 年突破 20,000 个大关,社区不断发展。

  • 这凸显了开源社区对 CI/CD 和社区管理自动化的认识不断增强。

超过 80% 的 GitHub 贡献都贡献给私有存储库。其中,私人项目贡献超过 42 亿美元,公共和开源项目贡献超过 3.1 亿美元。这些数字显示了通过免费、团队和 GitHub Enterprise 帐户在公共、开源和私人存储库中发生的活动的巨大规模。大量的私人活动表明了内部源代码的价值,以及基于 Git 的协作不仅有利于开源代码的质量,而且也有利于专有代码的质量。

事实上,在最近 GitHub 赞助的一项调查中,所有开发者都表示他们的公司至少采用了一些内部源实践,超过一半的开发者表示他们的组织中有活跃的内部源文化。

GitHub 是开发者操作和扩展 云原生 应用程序的地方。2023 年,430 万个公共和私有存储库使用 Dockerfile,超过 100 万个公共存储库使用 Dockerfile 来创建容器。过去几年, GitHub 看到 Terraform 和其他云原生技术的使用量不断增加。IaC 实践的增加也表明开发者正在为云部署带来更多标准化。

开源状态

2023 年,开发者为 GitHub 上的开源项目做出了总计 3.01 亿的贡献,其中包括 Mastodon 等热门项目到

Stable> Diffusion

LangChain等生成式AI 项目。

商业支持的项目继续吸引一些最开源的贡献,但 2023 年是生成式 AI 项目也进入 GitHub 上十大最受欢迎项目的第一年。说到生成式 AI,几乎三分之一拥有至少一颗星的开源项目都有一位使用 GitHub Copilot 的维护者。

商业支持的项目继续领先。2023 年,贡献者总数最大的项目获得了压倒性的商业支持。这是去年以来的持续趋势,microsoft/vscodeflutter/fluttervercel/next.js在> 2023 年再次跻身前 10 名。

生成式人工智能在开源和公共项目中快速发展。2023 年, GitHub 看到基于 AI 的生成式 OSS 项目,如langchain-ai/langchainAUTOMATIC1111/stable-diffusion-webui,在GitHub 上按贡献者数量跃居榜首。越来越多的开发者正在使用预先训练的人工智能模型构建法学硕士应用程序,并根据用户需求定制人工智能应用程序。

开源维护者正在采用生成式人工智能。几乎三分之一拥有至少一颗星的开源项目都有使用 GitHub Copilot 的维护者。这是 GitHub 向开源维护人员免费提供 GitHub Copilot 的计划,并表明生成式> AI 在开源领域的采用日益广泛。

开发者看到了组合包和容器化的好处。正如 GitHub 之前指出的,2023 年有 430 万个存储库使用了 Docker。另一方面,Linux 发行版NixOS/nixpkgs在过去两年中一直位居贡献者开源项目的榜首。>

首次贡献者继续青睐商业支持的项目。去年, GitHub 发现,与其他项目相比,围绕流行的、商业支持的项目的品牌认知度吸引了更多的首次贡献者。这种情况在 2023 年继续出现,一些在 Microsoft、Google、Meta 和 Vercel 支持的首次贡献者中最受欢迎的开源项目。

但社区驱动的开源项目从 github.com/home-assist… 到AUTOMATIC1111/stable-diffusion-webui、langchain-ai/langchain和Significant-Gravitas/Auto-GPT 也见证了首次贡献者的活动激增。这表明,基础模型的开放实验增加了生成人工智能的可及性,为新的创新和更多合作打开了大门。

2023 年,首次为开源项目做出贡献的贡献者数量最多。新的开发者通过 freeCodeCamphttps://github.com/freeCodeCamp/freeCodeCamp、First ContributionsEducation]education.github.com/ 等计划参与到开源社区中。GitHub 还看到大量开发者参与了Google等公司的在线开源教育项目。

开发者正在为开源生成式人工智能项目做出贡献,开源维护者正在采用生成式人工智能编码工具,而公司则继续依赖开源软件。这些都表明,公开学习并分享新技术实验的开发者提升了整个全球开发者网络——无论他们是在公共存储库还是私人存储库中工作。

take-this-with-you


正如 Git 已成为当今开发者体验的基础一样, GitHub 现在也看到了人工智能成为主流的证据。仅在过去一年,就有高达 92% 的开发者表示在工作内外使用基于人工智能的编码工具。在过去的一年里,GitHub 上托管的各种开源项目的人工智能实验也出现了爆炸性增长。

GitHub 的三个要点:

  1. GitHub 是生成式 AI 的开发者平台。 生成式 AI 将于 2023 年从专业领域发展成为主流技术,开源活动的爆炸式增长反映了这一点。随着越来越多的开发者构建和试验生成式 AI,他们正在使用 GitHub 进行协作和集体学习。

  2. 开发者正在 GitHub 上大规模运行 云原生 应用程序。 2019 年, GitHub 开始看到开源中使用基于容器的技术的开发者数量大幅增加,并且越来越多的开发者使用基于 Git 的 IaC 工作流程、容器编排和其他云原生技术的速度急剧增加 2023 年。如此大量的活动表明开发者正在使用 GitHub 来标准化他们将软件部署到云的方式。

  3. GitHub 是开源社区、开发者和公司构建软件的地方。 2023 年, GitHub 看到私有存储库的数量增加了 38%,占 GitHub 上所有活动的 81% 以上。但 GitHub 看到开源社区持续增长,他们使用 GitHub 来构建未来并推动行业向前发展。数据显示新的开源开发者的增加以及开放社区可能实现的快速创新步伐,很明显开源从未如此强大。