博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
GitHub十周岁HanLP自然语言处理包用户量超越CoreNLP
阅读量:6973 次
发布时间:2019-06-27

本文共 1010 字,大约阅读时间需要 3 分钟。

hot3.png

GitHub十周岁HanLP自然语言处理包用户量超越CoreNLP

 

在本周,GitHub终于度过了属于它自己的十周岁生日。这个在2008年由3个来自旧金山的年轻人创建的基于Git的代码托管网站,先后超越了元老级的SourceForge和背景强大的Google Code,成为了全世界范围内最受欢迎的代码托管网站。

11ba5daf10f13af8f31cf4b338fe4449a5e.jpg

“十年前的今天,GitHub 正式上线。最一开始,我们只有一个特别简单的目标:链接所有的开发者,让他们用Git更轻松地进行项目协作。”联合创始人Chris Wanstrath在博客里写道,“十年过去了,我们作为公司,作为平台都有了很大的变化,但GitHub存在的意义从未改变。”

截至到去年5月底,GitHub完成了第1亿个PR合并请求命令。截至今天,GitHub上已经能够拥有超过8000万个repo,活跃用户达到2700万人,超过150万家公司和机构进驻。大快搜索的HanLp自然语言处理开源项目同样进驻了GitHub。

GitHub团队作为对十周年的纪念和庆祝,并没有像大多数公司一样选择回顾公司的发展历史,而是整理了一份过去十年的几大里程碑事件。这份光荣,不止属于平台自己,更是属于那些为了让这个世界变得更好,通过Git、GitHub、用JS、Python和各种语言共享代码的人们。

在GitHub十周年之际,大快搜索AI研究小组的,自然语言处理专家Hancks所主持的HanLP开源项目,全球用户量首次超过了斯坦福大学的CoreNLP,以及老牌的自然语言处理开包Ansj,成为全球范围内最受开发人员喜爱的自然语言处理技术。

361fac552835409b36a57a6e01dfb0ede7f.jpgd5be2697b1fd97d90204cdc01e3db1864a5.jpg

 

自2014年首次发布,通过3年的不断迭代,HanLP的分词准确性和分词速率得到了极大的提升。据阿里杨尚川的一份测评报告显示,HanLP的分次准确率在全球排名第三,分词速度在全球排名第一。卓越的性能自然带来了大量的使用者。终于,在太平洋时间10月25日,GitHub上HanLP的用户量超过Stanford-CoreNLP。

ac9b4a79241b3c2c594a88b8cfdbf112382.jpg

自然语言处理是人工智能的一个重要分支,HanLP的用户量证明了国产技术的高性能与可靠性,也再一次证明了大快搜索用心做技术、专注于大数据与人工智能基础软件的决心。大快今后也将开发出更多组件用于建设大数据与人工智能生态,绘出人工智能与大数据的中国智慧。

转载于:https://my.oschina.net/u/3970810/blog/2240106

你可能感兴趣的文章
电商仓储控制超卖的策略
查看>>
windows系统安装MongoDB
查看>>
[转]Peer-to-Peer Communication Across Network Address Translators
查看>>
C++临时变量的生命周期
查看>>
Remove Element
查看>>
高淇Struts2.0教程之视频笔记(7)
查看>>
自适应SimpsonSimpson积分
查看>>
初学WebGL引擎-BabylonJS:第2篇-基础模型体验
查看>>
Python的垃圾回收机制以及引用计数
查看>>
C语言经典实例1: 类型长度与类型转换
查看>>
用DateTime.ToString(string format)输出不同格式的日期
查看>>
[转July]KMP算法(mark)
查看>>
mysql获取表列信息、主键信息
查看>>
用POI的HSSF来控制EXCEL的研究
查看>>
jvm09
查看>>
require标识符分析
查看>>
随手记
查看>>
基础JSP学习
查看>>
C# try catch语句&获取随机数的方法
查看>>
第一个shell编程,输出hello world!
查看>>