BIGDATAとは?AIの進化によってビックデータの活用が促進される

BIGDATAの概要(ビックデータ)

総務省によるBIGDATA(ビックデータ)の定義として「事業に役立つ知見を導出するためのデータ」とし、ビッグデータビジネスについて、「ビッグデータを用いて社会・経済の問題解決や、業務の付加価値向上を行う、あるいは支援する事業」と書かれています。

またBIGDATAには「4つのV」の要素があります。

  • Volume 膨大であること

データの巨大さも、ひとつの基準の一つです。

数テラバイト ~ 数ペタバイトの容量の事。

  • Variety 多様性であること

様々なデータの種類があり、あらゆる形式のデータ。

  • Velocity 高速であること

リアルタイムかつ高速でデータ保存され続ける。

  • Value 価値として活用できる

保存するだけでなく、問題解決や業務の付加価値として活用していくこと。

BIGDATAの分類

BIGDATAは、国や地方公共団体、企業、個人が主体となって発生するデータで大きく分けると次のように分類されます。

国や地方公共団体:オープンデータ

オープンデータは、国や地方公共団体が提供する公共情報のことで、「官民データ」とも呼ばれます。BIGDATAとしては活用方法や施策が進んでいる分野のひとつです。国はBIGDATAの有効活用を推進しており、保有しているデータを活用して、ビジネスや、事業の効率化などのために開示を推進しています。

企業:ノウハウ

企業が主体となるデータは、企業のノウハウをデジタル化した情報で「知のデジタル化」とも呼ばれています。ビジネスにおけるノウハウは、人に蓄積されるものですが、さまざまな産業や分野でノウハウの蓄積をデジタル化する取り組みが推進されています。

企業:M2M(Machine to Machine)からのストリーミングデータ

M2M(Machine to Machine)とは、機器と機器の間でダイレクトに接続して情報を交換することです。M2Mからは大量のストリーミングデータが発生します。たとえば、企業の生産現場でIoT機器から収集されるリアルタイムのデータなどがあります。「知のデジタル化」と「M2M」を合わせたものを「産業データ」とも言います。

個人:パーソナルデータ

パーソナルデータには、属性、移動、行動、購買など個人が特定できるいわゆる個人情報にプラスして、匿名加工情報といわれる個人が特定できないように加工された人流情報や商品情報も含まれます。

BIGDATAが、国や地方公共団体、企業、個人の間で相互に連携され、データの循環が活発におこなわれることで、さまざまなデータが共有活用され社会全体が発展することが期待されています。

クラウドの普及で、高度なデータ処理が、ハイスペックな機器を保有していなくても可能となった事や、AIの進化によって計算能力が向上したことでBIGDATAの共有活用のさらなる浸透が進んでいます。

BIGDATAの活用

近年のICT(情報通信技術)の発達によって、多種多様なBIGDATAが大量にリアルタイムで生成、収集、蓄積できるようになってきています。そのため、何らかの異変や危険を早期にキャッチし、近い将来の予測にBIGDATAを使うことができるようになってきました。

またBIGDATAは、ビジネスにおける消費者のニーズに合った商品やサービスの提供や業務の安全と効率化、新たなイノベーションによる新事業の 創出に役立つことが期待されています。

AWSでビッグデータソリューションの構築をするなら以下がポイント

Hadoop を使用してビッグデータを分析するなら、Amazon EMRの活用
・機械学習モデルの構築をするならAmazon Machine Learning (Amazon ML)を活用
ログ分析ソリューションを構築するならAmazon KinesisElasticsearch Service を使用してログデータを収集、処理、分析しましょう!