2018年度IT168技术卓越奖名单:大数据类

副标题#e#

  2016年之前,大数据相关创业公司很容易拿到融资,从几百万到数亿不等,甚至有人乐观估计,到2020年,整个产业规模将超过13000亿。然而,这之后就有人喊大数据寒冬已至,但此时依然有资本眷顾这个领域。到2017年《网络安全法》实施,整个行业进入调整期。

  2018年度IT168技术卓越奖名单:大数据类

  2018年,凛冬真正来临,过去10个月的融资发生率不到去年的50%,一场“中兴之战”惊醒众人:国内大数据市场需要从底层核心技术入手,而非应用。这一年,企业开始努力打造全栈大数据平台,涵盖大数据操作系统、数据采集、存储、加工、计算、挖掘、分析等环节,并在大数据平台之上搭建人工智能解决方案。

  在过去一年,企业在运用大数据方面主要有如下变化:

  中小企业倾向于从云平台获取大数据能力

  目前,大数据领域基本是三分天下:BAT、华为等巨头系,TalkingData、华云数据、Dataeye等创业系,电信、移动、联通等国有系。在过去一年,云计算终于开始改变大数据行业格局,中小企业或者说集群规模相对较小的企业更倾向于从云平台获取大数据能力,这部分企业大多属于创业系,其选择云厂商的原因也很简单:一是降低自建大数据平台成本,虽然选择云平台同样需要付出一定成本,但在集群规模较小时,花费是比较低的,企业相对容易接受;二是大部分可修改源码级别的工程师均被巨头系垄断,这也让中小企业难以搭建并运维一套完整的大数据平台;三是云厂商提供的大数据服务更加丰富完善,并经过众多行业案例验证,以数据治理为例,中小企业很难有精力搭建这套服务。

  国内顶尖云提供商大数据生态日益完善

  自2011年,谷歌就率先推出了名为BigQuery的革命性服务,以完全不同的方式解决了同样的问题,允许对存储在其对象存储服务中的数据运行即席查询(无需将其加载到HDFS等存储中)。如今,国内的云厂商可直接提供Hadoop/Spark服务和对象存储服务。从主流云厂商的官网可清晰看出,其云大数据服务已经涵盖数据存储、数据计算、数据分析、数据可视化等环节,甚至加入了不少AI能力,国内巨头系云厂商的大数据服务生态已日趋完善,这会促进中小企业对这类云平台大数据服务的采纳。

  容器、Kubernetes和机器学习成为关键趋势

  Hadoop和Spark不仅仅是一个存储环境,也是一个计算环境。容器和Kubernetes与机器学习一样,为分布式计算提供了更加灵活和强大的框架。过去一年,企业开始逐渐放弃在Hadoop或Spark之上分发新的微服务应用程序,因为这过于复杂且有所限制,企业更倾向于在容器之上运行分布式云数据库和应用程序,使用Pyhton、R或者其他非Java语言进行机器学习。越来越多的企业正在积极探索容器、Kubernetes和机器学习,因为这可以获得更优的性能和更好的规模效益。

  部分行业成为大数据的集中发力点

  根据全球Hadoop and Big Data Analytics Market 提供的一份2018年市场行业分析报告显示,银行、金融和保险业将在未来五年继续主导Hadoop和大数据分析市场,这主要是由于越来越多的部门采用信息技术解决方案来改善银行服务。在线交易激增导致银行越来越多地采用电子资金转账(NEFT)、实时总结算系统(RTGS)、电子结算服务(ECS)以及移动交易等技术。多年来,银行、金融和保险业一直是网络欺诈的最大受害者,欺诈数量的不断增加反过来促进了银行和金融业对Hadoop和大数据分析解决方案的需求。

  不难看出,2018年,大数据行业发生了不小的变化,在大数据市场逐渐趋于稳定的一年,又有哪些产品足以让我们眼前一亮呢?

#p#副标题#e#

  一句话点评:荣之联BioStack是一款为了满足生物信息分析对于速度、规模和智能化的苛刻需求所打造的高度垂直的、全栈的、专业的生物信息分析系统。

2018年度IT168技术卓越奖名单:大数据类

  ▲最佳创新产品奖:荣之联新一代生物信息分析平台Biostack

  产品介绍:荣之联BioStack从根本上解决了生物信息行业所面临的数据规模问题,充分利用计算和存储资源,灵活有效的解读高复杂度的生物数据关系和结构,让生物数据的价值大放异彩。

  Biostack具有三大核心优势特性:生物数据感知、生物应用感知和多样化计算。在生物数据感知层面,其数据管理系统Metaview能够协助生信分析动态组织数据集合;秒级快速发现数据;多维度观察数据特征和数据溯源;关联组学数据和表形信息,助力挖掘生物信息大数据。

  在生物应用感知层面,BioStack有多套面向生物信息专门设计的分布式存储系统,理解生信应用,极致性能优化;BioStack能根据数据存取模式、计算框架的不同,通过存储系统和计算平台的配合,感知生物信息应用,调度分析计算过程的同时自动调度数据到合适存储模型和存储位置。

  在多样化计算层面,生信科学家在Bioflow执行引擎上完全不需要关心计算框架的差异,可以轻松构建一个混合计算框架的流程。Bioflow提供了丰富的表达方式BSL、WDL以及可视化编排。这大大降低了生信科学家对并行编程能力的要求,在简单的语言描述下,组织高质量,高并行,健壮的复杂分析流程。Bioflow计算平台不单单是一个分布式调度器,而且还是生信分析的高级执行引擎。包括了完整流程编排,流程管理等。

  获奖理由:生物信息领域所需分析的数据既多又杂,因此对分析系统的专业度和精准度要求颇高。有别于市面上通用硬件加通用软件堆砌的生物信息分析系统,BioStack是为生物信息专门设计的自底向上的完整数据系统,可以一次性解决生物信息数据的存储、数据管理、数据分析、数据计算和特征数据挖掘等工作,是一个高度垂直的、全栈的、更专业的生物信息分析系统。

#p#副标题#e#

#p#副标题#e#

#p#分页标题#e#

  产品介绍:XData-EDU大数据与深度学习教学实训一体机基于曙光大数据多年的技术积累和实践经验,以及在人工智能领域的创新,采用灵活、轻量的容器技术提供大数据与人工智能实验环境,内置主流大数据组件与深度学习软件框架。利用容器调度技术,支持上百套容器实验集群的管理与调度,使用户独享实验环境,一键开启与关闭容器集群成为可能。

  针对教学实训真实场景量身定制教学管理系统、实验开发环境,以及结合一线实战项目,提供多门具有实践性的大数据与人工智能理论课程和实验课程,帮助用户建设大数据与深度学习教学实训课程,为大数据与人工智能领域的人才培养和科学研究提供了有力支撑。

  XData-EDU对大数据平台进行了优化,包含分布式文件系统、离线计算、内存计算等主流软件;教学管理模块可提供学生管理、班级管理、课程管理、成绩考核等教学实训管理相关功能;实验开发模块面向大数据平台多个组件的集成IDE开发调试环境,并预置开发示例代码;实验运行模块提供基于图形化的实验作业提交、作业运行、任务调度和实验结果查看功能;运维管理模块提供图形化的运维功能,便于进行监控、告警、配置、诊断等系统管理功能;教学实训课程结合一线的实战项目,提供多门具有实践性的教学课程讲义和实验课程指导。

  获奖理由:当前,大数据和人工智能是企业的重点技术布局方向,但相关人才缺失让企业有心无力。XData-EDU大数据与深度学习教学实训一体机是曙光大数据与人工智能技术实践心得的完整展现,对于企业人才培养和项目实施具备重要意义。

#p#副标题#e#

  DataBridge的核心优势包括支持各种主流关系型数据库和大数据平台,支持各种类型数据文件;采用分布式架构、多线程、多进程执行任务,线性提升执行性能;B/S架构,图形化开发、运维界面,可自定义调度计划,根据业务需要周期性对作业进行自动调整,无需人工干预;任务断点续传和自动回滚功能以及单点容错机制,保证整体作业的高可用。

  获奖理由:数据集成平台DThink DataBridge是数梦工场科技有限公司研发并拥有完全自主知识产权的一款基于分布式架构的ETL数据集成产品,其适配各类数据源,提供无侵入式的增量获取功能,具有高速的数据集成能力。

#p#副标题#e#

  一句话点评:日志易2.2版本是一款专业的日志搜索分析产品,将日志分析产品做得像Google搜索引擎一样简单、灵活且易用。

2018年度IT168技术卓越奖名单:大数据类

  ▲最佳创新产品奖:北京优特捷信息技术有限公司日志易2.2版本

  产品介绍:北京优特捷信息技术有限公司围绕用户的核心需求——日志集中管理与搜索分析,推出专业的日志搜索分析产品“日志易”,对日志进行集中管理,提供实时搜索、关联分析、监控告警、多维统计和数据可视化等功能,帮助企业进行运维监控、安全合规审计及业务数据挖掘。

  日志易是一个配置灵活、功能丰富、易于使用的日志管理工具,它对日志进行集中采集和实时索引,提供搜索、分析、可视化和监控告警等功能,帮助企业进行线上业务实时监控、业务异常原因定位、业务日志数据统计分析、安全与合规审计。其核心优势在于自研引擎;强大的SPL语言可让用户在搜索框里编程,使日志分析更加灵活,满足各种统计分析需求;针对各种场景和日志格式的APP应用,让日志易使用范围更加广泛;实现异常自动发现、KPI检测、容量预测、根因分析等AIOps功能。

  此外,北京优特捷信息技术有限公司提供在大中型企业内部数据中心部署的日志易企业版,也通过公有云提供SaaS服务,帮助用户实现更广泛场景下的日志分析任务。

  获奖理由:日志易是中国第一款自研日志搜索分析引擎,每天可处理上百TB日志量,秒级处理延时。其目前已在上千家用户企业得到实践,拥有2000+节点,效率可达到每秒5000k,处理的数据量已达PB级别。

#p#副标题#e#

#p#副标题#e#

  一句话点评:Pentaho可以大规模集成、混合、准备和分析任何数据,消除IT复杂性和延迟,可无缝集成到企业现有基础架构中。

2018年度IT168技术卓越奖名单:大数据类

  ▲创新解决方案奖:Hitachi Vantara Pentaho

  产品介绍:Pentaho可以让用户具备更快访问、准备和混合多个数据源的能力,让管理流入企业的日益增加、复杂多变、多种类且速度越来越快的数据变得非常简单。Pentaho Data Integration (PDI) 通过可视化工具更快地为最终用户提供随时可用于分析的数据,从而缩短分析时间,并降低复杂性。企业无需编写SQL或者在Java和Python中编码,就可以立即从其数据中获取真正价值,这些数据可来自文件、关系数据库、Hadoop等云端或本地。

  2018年12月发布的最新版本Pentaho 8.2,提供与HCP的即用型全新集成,同时更好地整合Hitachi Vantara的产品组合并帮助用户通过利用来自HCP的非结构化数据满足关键行业用例需求,该版本还提供管理混合云环境的全新方式并扩展了对分析生态系统的支持,而Pentaho Business Analytics还提供了简体中文用户界面支持。HCP产品组合的增强可帮助企业在从数据中心到云端、再到边缘的整个环境中充分利用数据,并将其应用到当今数据驱动的数字化业务环境中,主要具备以下三大亮点:

  1、云原生兼容性:HCP能够更好得兼容工业标准Amazon S3 API。这使得HCP能够支持新的应用要求和不断扩展的ISV应用生态系统。企业现在可以结合使用HCP与大数据应用,通过从第一层存储中卸载内容来节省成本。

#p#分页标题#e#

  2、灵活的部署选项:除了纯软件和设备型号外,新增的VMware vSAN支持使得HCP能够在超融合环境中运行,包括Hitachi Vantara的UCP(Unified Compute Platform)等,以确保实现更优的可用性、性能和可靠性。

#p#副标题#e#

  3、增强的性能监控:借助Hitachi Content Monitor,企业可以将多个HCP集群系统指标聚合到可定制仪表板上,并以图形化方式进行呈现。这将可以帮助企业轻松管理和治理大规模数据,并利用从中获得的洞察保持最佳性能。

  获奖理由:企业已认识到数据是增长和创新的关键因素,Pentaho混合了数据集成和业务分析能力,最终成为让企业可以跟上指数级大数据增长趋势的综合大数据分析技术。其最新版本可让企业快速拥抱云平台,降低成本、提高盈利能力的同时扩展数据治理功能以降低多云环境中的风险,加快企业数字化转型。

  结语

  当然,大数据市场还存在着很多优秀企业和产品。未来,大数据市场将会加快向云端迁移的脚步,云原生服务与本地自建服务之间的抉择会成为新的问题,更多企业会将精力投向云计算、边缘计算和人工智能,大数据市场势必会迎来新的冲击!

dawei

【声明】:嘉兴站长网内容转载自互联网,其相关言论仅代表作者个人观点绝非权威,不代表本站立场。如您发现内容存在版权问题,请提交相关链接至邮箱:bqsm@foxmail.com,我们将及时予以处理。