日志易挖掘价值

2023-05-30 10:07何己派
21世纪商业评论 2023年3期
关键词:搜索引擎日志运维

何己派

“上知天文、下知地理”的ChatGPT火了,数据这门资产的重要性,从未提升到如此高度。

大数据这个广而又广的概念下,大量非结构化数据如同一条暗河,潜伏在由数十亿互联设备、无数云服务包裹的数字世界。若能尽可能地转化这些混乱无序的数据,带来的信息价值,将相当可观。

今年1月宣布完成C轮融资的日志易,做的就是这门转化的生意。

这家日志管理与分析平台开发商,致力于幫企业挖掘和利用机器数据价值,企业IT系统、设备每时每刻产生的日志,是它的拿手领域。

14年前,39岁的陈军接到一通猎头电话,毅然决定离开待了12年的硅谷,回国发展。辗转腾讯、高德等公司几年后,2014年他创办日志易,选定IT运维分析的创业方向。

To B圈沉潜多年的“老炮儿”,大器晚成,融资一路很顺。

公司成立当月,还没有产品,就拿到徐小平真格基金等投资者1400万元的天使轮。

而后红杉两轮加持,C轮融资在2022年,整个企业服务赛道都相当艰难的背景下完成,投资方为某知名产业投资机构。

日志易的核心客户群,瞄准规模最大的3000家中国企业和机构,它们年度IT预算基本过亿,对IT运维有着极高要求。

自2015年起,公司连续数年销售收入同比增长超100%,2022年营收过亿,目前已服务超700家大型企业和机构,标杆客户包括中国银行、光大证券、国家税务总局等。

“IT运维是道生命线。数据安全治理,在许多企业是一把手责任制。”

陈军形容其为水和电,“大家习惯了一打开开关就有电,拧开水龙头就有水,很难感知其重要性,但一旦停电停水,影响非常大。IT运维也是这样。”

选在繁忙的会议间隙,陈军和《21CBR》记者聊了聊IT运维行业的变化、日志易的创业故事以及公司接下来的规划。

IT人生

我接触计算机很早。

还记得上世纪80年代中期时,苹果II型电脑,1万多块钱一台,对比普通人一个月200元的工资,电脑绝对是奢侈品。

母亲是广东海洋大学计算机教授,我从小耳濡目染,6岁开始玩旧式的计算机打孔纸片,14岁开始学Basic编程语言,90年代中期成为第一代网民。

1998年,从美国南加州大学硕士毕业以后,我一直在硅谷工作,从思科到谷歌,主要做云计算和搜索开发。

2009年,一个越洋猎头电话,让我做了回国的决定,加入腾讯,做大规模数据中心运维及云计算,而后又转战高德做技术副总裁。2014年高德被阿里收购以后,我想,是时候出来做点事了。

分析各种创业方向,美国的Splunk用搜索引擎来处理日志的想法很独特,给我留下挺深的印象。Splunk在2011年进入中国市场,售价昂贵,当时没有国内公司做同类的产品,市场存在机会。

2014年初日志易成立,我们成为第一家用搜索引擎来处理日志的中国企业。

所谓日志,是计算机系统所产生的机器数据,蕴含大量能直观反映系统运行状况的重要信息,有非结构化的特点。

传统做法是用数据库对日志进行存储和分析,但效率不高,且数据库不适用日志这种没有固定格式的数据。若利用搜索引擎,抽取字段将日志文本做类似网页搜索的处理,IT人员就可以用关键词搜索任意数据,像搜索网页一样方便,并能在此基础上做各式各样的分析。

这件事要想做成,需要两方面的能力,一得懂IT运维监控,二得懂搜索引擎,把搜索这个To C的东西,转化成为日志处理的工具。恰好,创始团队拥有这两块技术背景。

公司成立的同年10月,产品就做出来了。

那时SaaS创业火热,起初,我们做的也是SaaS版本,放在公有云上,并在2015年1月拿到第一笔收入,来自一家小型创业公司,给了1万多块钱。

尝试了半年,我们得出来一个判断,做SaaS赚不到钱,也很难吸引大客户。公司马上调整方向,决心做本地化部署,主攻大型企业。

日志易的第一个大客户,是家大型金融科技机构,公司通过试用切入,投了不少人力对接需求,花了半年时间终于签下。

金融、运营商、能源等行业,是公司重点布局的领域。

这些行业每天面临海量数据的产生,痛点很明显:日志数据产生于不同业务部门,分散在不同服务器上,规模可达上百TB级,缺乏集中收集和管理;系统一旦出现问题,需要登陆服务器进行事后手动查找和分析,这个过程耗时且效率低。

以一个统一日志管理平台,对日志实现集中采集、存储和实时索引,乃至分析、可视化和监控告警,实现的是日志全生命周期管理。相当于把事后管理变成事中,一出现故障苗头,秒级告警。

T型战略

日志易的早期产品版本,是基于通用开源软件做的。服务大客户时,我们意识到,TB级别的数据量,开源软件无法满足处理需求,不可持续。

公司要想长期发展,必须走向自研,开发自己的搜索引擎。

这个想法真正落地,花了整整3年。2018年底,公司发布了自研日志搜索引擎Beaver,技术指标较开源搜索引擎有大幅提升,填补了国产空白。

过程很辛苦,中间有人动摇、离开。做自研的同时,双线并行,老业务依旧在同步发展,不断叠加功能,这是考虑到一旦停下,市场份额无法继续增长甚至倒退,会有经营风险。

从产品竞争力来看,日志易的优势主要在于两方面。

其一,自研的搜索引擎技术,数据处理性能提升5-10倍,可处理PB级新增海量日志,能完全实现自主可控,同时硬件成本减少50%。

其二,自研的低代码搜索处理语言SPL(Search Processing Language),专为日志分析而生,和传统的数据库查询语言SQL相比更加灵活,具有上手快、开发快、运行快等优势,可实现“在搜索框里编程”。

过去几年,我们以日志产品为核心,开始向更多领域横向拓展业务,发展的逻辑可以概括为“T型战略”。

所谓“T型”,一竖即深耕日志,深挖机器大数据的价值,一横指延伸开来的场景,已形成三条产品线,运维分析、安全分析、数据治理,每个产品线下又有多个产品,由此形成产品矩阵。

比如,安全分析这块,2019年切入,目前已有SIEM安全大数据分析平台、用户实体行为分析UEBA等安全产品。

从日志的角度发现安全攻击,日志易做这事有天然优势。

当前市面上做安全态势感知的厂商,很多基于国外开源日志搜索软件二次开发,一天只能处理几百GB的数据量,再往上走非常吃力,并且安全分析规则内置固化在产品里,变通性较差,安全攻击往往“道高一尺,魔高一丈”。

基于SPL的安全事件分析,较传统的内置安全分析规则,可扩展性更强,分析是随时随地进行的。产品在应对新的安全攻击的时候,能不断演进,对客户来说,这也是投资保护,不至于因为产品过时而需要定期购买新产品。

回过头来看日志易的开发节奏,从公司成立到拿下第一个大客户,日志分析產品花了18个月,安全产品从2019年5月开发到签下第一个大型股份制银行客户,也是18个月。

公司积累沉淀了一套产品开发方法论,从产品设计到签下行业标杆大客户,基本用时不到2年。

跨越鸿沟

做To B的软件企业,得迈过两道坎,16%的市场渗透率、1个亿的收入。对日志易来说,我们跨越了鸿沟。

日志易瞄准中国最大的3000家企业和机构,目前进度已到700多家,市场渗透率超过20%,金融行业的渗透率更高,大约超过30%。

2021年,公司实现订单金额过亿,2022年订单金额、营收均过亿,营收增长超30%。

尽管去年整个投融资大环境比较惨淡,日志易依然完成了C轮融资。

行业分布来看,金融、运营商、能源等行业客户贡献较大,且老客户复购率较高,客单价逐年稳步提升。

IT运维领域,对新技术的追赶,中国大约落后美国五年。

几个数据来看,中国IT支出占GDP的比重仅1.4%,相较美国的4.7%仍有较大差异;中国的GDP占了全球的1/6,但IT支出只占全球的12%,同样不成正比;软件开支差异更大,中国软件支出占GDP的0.1%,美国是1.1%。

这意味着,未来中国的企业和政府数字化转型,仍有巨大红利和增长空间。

近几年,自主可控的IT信创如火如荼,大量核心组件需要逐步从原来国外大厂的成熟产品替换为新开发的信创产品,这些新产品的稳定性有待提升,给IT系统的运维监控和排障带来新挑战。

日志易2020年开始投入信创领域,已能实现国产信创操作系统的全部适配,坚定看好这个方向。

新兴技术方面,公司在2018年开始开发智能运维的产品,将机器学习的算法用在运维领域。

ChatGPT的出现,带给了我们启发,已在着手研究如何利用过去9年在机器大数据分析领域的积累,结合ChatGPT这类通用大模型,搭建日志分析的ChatGPT,“培养”一个专攻IT运维知识的AI专家。

中长期而言,我们希望能在三至五年内,完成科创板上市的目标,终极的愿景,则是成为机器大数据领域的龙头,服务几千家大型企业客户。

我想,中国有这样的市场体量和需求,日志易也具备这样的前提条件。

猜你喜欢
搜索引擎日志运维
一名老党员的工作日志
扶贫日志
运维技术研发决策中ITSS运维成熟度模型应用初探
风电运维困局
杂乱无章的光伏运维 百亿市场如何成长
游学日志
基于ITIL的运维管理创新实践浅析
网络搜索引擎亟待规范
Nutch搜索引擎在网络舆情管控中的应用
基于Nutch的医疗搜索引擎的研究与开发