Oracle宣布Oracle云数据科学平台

2020-02-18 17:23:05    来源:    作者:

新服务使数据科学团队能够快速,轻松地协作构建和部署强大的机器学习模型

Oracle宣布推出Oracle Cloud Data Science Platform。Oracle Cloud Infrastructure Data Science的核心是,它可以帮助企业协作构建,训练,管理和部署机器学习模型,以提高数据科学项目的成功率。与其他专注于单个数据科学家的数据科学产品不同,Oracle云基础架构数据科学通过共享项目,模型目录,团队安全策略,可再现性和可审计性等功能来帮助提高数据科学团队的效率。Oracle Cloud Infrastructure Data Science通过AutoML算法的选择和调整,模型评估和模型解释,自动选择最佳的训练数据集。

Oracle宣布Oracle云数据科学平台

如今,组织仅意识到数据巨大变革潜力中的一小部分,因为数据科学团队无法轻松访问正确的数据和工具来构建和部署有效的机器学习模型。最终结果是,模型花费的时间太长,无法始终满足企业对准确性和鲁棒性的要求,并且过于频繁地永远无法将其投入生产。

“有效的机器学习模型是成功的数据科学项目的基础,但是企业面临的数据量和种类繁多,可能会使这些计划在付诸实践之前就停滞不前,” Oracle Data and AI产品开发高级副总裁Greg Pavlik说。服务。“借助Oracle Cloud Infrastructure Data Science,我们可以通过自动化其整个工作流程并增加强大的团队支持协作来提高单个数据科学家的生产力,以帮助确保数据科学项目为企业带来真正的价值。”

专为数据科学团队和科学家而设计

Oracle Cloud Infrastructure Data Science包含自动化的数据科学工作流程,可通过以下功能节省时间并减少错误:

AutoML自动算法选择和调整 使针对多种算法和超参数配置的运行测试过程自动化。它检查结果的准确性,并确认选择了最佳模型和配置以供使用。这为数据科学家节省了大量时间,更重要的是,它旨在使每位数据科学家都能获得与最有经验的从业人员相同的结果。

自动预测特征选择 通过从大型数据集中自动识别关键预测特征来简化特征工程。

模型评估会 生成一套全面的评估指标和合适的可视化文件,以针对新数据衡量模型的性能,并可以随时间对模型进行排名,以实现生产中的最佳行为。模型评估超出了原始性能,要考虑到预期的基线行为,并使用成本模型,以便可以完全合并误报和误报的不同影响。

Oracle宣布Oracle云数据科学平台

模型说明: Oracle Cloud Infrastructure Data Science提供有关生成预测的因素的相对权重和重要性的自动说明。Oracle Cloud Infrastructure Data Science提供了不可知模型的第一个商业实现。例如,借助欺诈检测模型,数据科学家可以解释哪些因素是欺诈的最大驱动因素,因此企业可以修改流程或实施保护措施。

成功地将有效的机器学习模型成功投入生产,不仅需要专门的人员。这需要数据科学家团队共同合作。Oracle云基础架构数据科学提供强大的团队功能,包括:

共享项目可 帮助用户组织,启用版本控制并可靠地共享团队的工作,包括数据和笔记本会话。

使用模型目录, 团队成员可以可靠地共享已经构建的模型以及修改和部署它们所需的工件。

基于团队的安全策略 允许用户控制对模型,代码和数据的访问,这些模型,代码和数据已与Oracle Cloud Infrastructure Identity and Access Management完全集成。

可再现性和可审计性 功能使企业能够跟踪所有相关资产,从而即使团队成员离开,也可以复制和审计所有模型。

借助Oracle Cloud Infrastructure Data Science,组织可以加速成功的模型部署,并产生企业级结果和性能以进行预测分析,以推动积极的业务成果。

全面的数据和机器学习服务

Oracle云数据科学平台包括七项新服务,这些服务可提供旨在加速和改善数据科学成果的全面的端到端体验:

Oracle云基础架构数据科学: 使用户能够使用Python和其他开源工具和库(包括TensorFlow,Keras和Jupyter)在Oracle Clou上构建,训练和管理新的机器学习模型。

Oracle自治数据库中强大的新机器学习功能:机器学习算法紧密集成在 Oracle自治数据库中, 并新增了对Python和自动机器学习的支持。即将与Oracle Cloud Infrastructure Data Science集成,将使数据科学家能够使用开源和可伸缩的数据库内算法开发模型。独特地,将算法应用于Oracle数据库中的数据可减少数据准备和移动,从而加快了实现结果的速度。

Oracle Cloud Infrastructure数据目录: 允许用户发现,查找,组织,丰富和跟踪Oracle Cloud上的数据资产。Oracle Cloud Infrastructure数据目录具有内置的业务术语表,可轻松组织和发现正确的可信数据。

Oracle宣布Oracle云数据科学平台

Oracle大数据服务: 提供完整的Cloudera Hadoop实施,与其他Hadoop产品相比,其管理要简单得多,只需单击一下即可使集群具有高可用性并实现安全性。Oracle大数据服务还包括用于Spark的机器学习,从而使组织可以使用一种产品和最少的数据移动在内存中运行Spark机器学习。

Oracle Cloud SQL : 对HDFS,Hive,Kafka,NoSQL和对象存储中的数据启用SQL查询。只有CloudSQL才能使能够与Oracle数据库对话的任何用户,应用程序或分析工具透明地使用其他数据存储中的数据,并具有下推,横向扩展处理的优势,可最大程度地减少数据移动。

Oracle云基础架构数据流: 一项完全托管的大数据服务,允许用户在无需部署或管理基础架构的情况下运行Apache Spark应用程序。它使企业能够更快地交付大数据和AI应用程序。与竞争的Hadoop和Spark服务不同,Oracle Cloud Infrastructure数据流包括一个窗口来跟踪所有Spark作业,从而使您可以轻松地识别昂贵的任务或解决问题。

面向数据科学的Oracle云基础架构虚拟机: 基于预配置的基于GPU的环境,具有常见的IDE,笔记本和框架,可以在15分钟内启动并运行,每天收费30美元。

客户在说什么

AgroScout致力于检测早期农作物病害,以提高农作物产量,减少农药使用并增加利润。“我们的愿景是使全球范围内有5亿个农场的10亿农民在经济上可以使用现代农业,占全球劳动力的30%。我们计划通过提供基于云的,由AI驱动的可持续农业技术来实现这一目标,它完全依赖于低成本无人机,手机和种植者的手动输入的输入,” Simcha Shore说,AgroScout创始人兼首席执行官。“这一愿景的成功取决于管理连续不断增长的输入数据流的能力以及我们自己的基于AI的解决方案,以将数据大规模转换为精确的决策农业。Oracle Cloud的速度,规模和敏捷性帮助我们实现了梦想。现在,最近增加的Oracle Cloud Infrastructure Data Science开辟了新的视野,它提高了我们的数据科学家协作构建,训练和部署机器学习模型的能力。这种增加降低了成本,提高了效率,并帮助我们更快地扩大了全球足迹。”

IDenTV基于计算机视觉,自动语音识别和文本语义分类器支持的AI功能提供高级视频分析。“借助Oracle云基础架构数据科学,我们可以扩展我们的数据科学工作,以前所未有的速度提供业务价值。我们的数据科学团队现在可以无缝访问数据,而不必担心数据位置或访问机制的复杂性。在使用嵌入到环境中的TensorFlow,Keras和Jupyter笔记本等开源功能时,我们可以简化模型训练和部署任务,从而节省大量成本并获得更快的结果,” Amro Shihadah说道。,IDenTV创始人兼首席运营官。“我们认为Oracle云基础架构数据科学与自治数据库的优势将为我们提供在市场上具有竞争力和独特性所需的优势。”

郑重声明:本文版权归原作者所有,转载文章仅为传播更多信息之目的,如作者信息标记有误,请第一时间联系我们修改或删除,多谢。