• 榮之聯
  • >
  • 產品創新
  • >
  • DataZoo大數據平臺

DataZoo大數據平臺

產品描述

DataZoo 是榮之聯以開源Apache Hadoop 為基礎, 結合行業特性構建的大數據平臺產品。為企業發掘數據價值、輔助業務決策、加速數據應用落地提供可靠支撐?;?/span>DataZoo 榮之聯提供端到端的大數據解決方案,已應用于公安、證券、電商、新媒體、車聯網及生物醫療等多個行業。

產品特點

完整的數據處理能力

具備數據分析生命周期各方面能力 集成開源先進技術,增加企業特性 整合行業經驗,打造基礎平臺與應用能力相結合的綜合能力

高性能多維分析引擎

超低時延:分析結果一觸即發 分析特性:任意維度組合分析、實時下鉆分析、外部數據關聯 存儲特性:嵌套列存儲,計算過程不加載多余數據 強擴展性:支持橫向縱向任意擴展 數據時效性:實時+ 離線數據

便捷的開發管理工具

數據模型開發工具 圖形化數據采集工具 端到端的圖形化管理工具

豐富的行業應用模型

駕駛行為分析 碰撞分析模型 用戶畫像 推薦模型 文本分析(分詞、情感分析)

產品架構


產品能力

1.     數據挖掘

分布式數據挖掘平臺,提供分布式的模型算法。為數據科學家提供熟悉的工作方式,直接在熟悉的R 語言工作臺編寫分析程序,在分布式內存引擎上執行,與平臺其他組件相互配合完成數據分析任務。DataZoo 積累了豐富的行業模型,尤其是在自然語言處理方面有大量的自主知識產權。


2.     實時流處理

DataZoo 實時流處理支持高度靈活的流式窗口,基于內存計算引擎保證數據分析的時效性。 接收實時數據,根據自定義時間間隔拆分為微批數據,處理后得到結果數據。穩定性經過大量測試,可以保證持續不斷的7*24 小時的計算。


3.     數據倉庫

DataZoo 數據倉庫建立在Hadoop 之上,底層存儲是HDFS 分布式文件系統, 提供完整的SQL 支持,用戶直接通過SQL 語言查詢數據。支持海量數據,具有高擴展性(存儲和計算兩個方面),可以運行在多種計算框架之上。



4.     多維搜索

DataZoo 多維搜索引擎是一個基于 Hadoop 分布式架構下的實時的、多維的、交互式的查詢、統計、分析引擎,具有萬億數據規模下的秒級性能表現,并具備企業級的穩定可靠表現。DataZoo 多維搜索引擎是一個細粒度的索引,精確粒度的索引。數據即時導入,索引即時生成,通過索引高效定位到相關數據。DataZoo 多維搜索引擎 Spark 深度集成, Spark 對檢索結果集直接分析計算,同樣場景讓 Spark 性能加快百倍。




5.     工具套件

可視化平臺管理工具

用戶可以很輕松地查看服務狀態、處理告警、監控集群資源;統一管理各個服務的運行參數,用戶無需到各個節點上進行修改,可直接通過界面進行統一操作。

可視化數據采集工具用戶可通過圖形化界面的拖拽操作,高效地進行數據抽取、清洗、轉換、過濾等操作。

可視化數據分析工具

可視化建模工具, 支持傳統的報表和圖表功能、自助分析、地理位置分析、What-If 分析和社交網絡分析等。



相關新聞

產品推薦

DataZooDataZoo大數據平臺
韩国色情片