ビッグデータ活用を
もっと身近に、もっと手軽に。
datist(デイティスト)は、ビジネスの決断に必要な
ビッグデータ活用をまるっとお任せできるサービスです。
datistは、クローリング技術を駆使したデータの収集から、自然言語処理や目視検査によるデータの正規化、データの可視化まで、 データの活用における一連のシステム構築と運用を、貴社に最適な形でご提供するサービスです。
サービス内容
Web上の必要なデータを収集
クローリングによるWeb上のデータ収集は、通常取得先のサイト構造に合わせて個別にプログラミングする必要があり、コストや手間がかかります。
datistでは、10億ページを超えるクローリング実績によって開発された汎用クローリングエンジンにより、様々なWebサイトごとに個別の開発をすることなく、データ収集をすぐ始めることができます。
データを活用できるカタチに加工
Web上にある多くの情報は、不必要な情報が多く含まれていたり、表記の揺れが多かったりなど、そのままの状態では分析や活用が難しいものがほとんどです。
datistでは、100種類以上の処理を行えるデータ加工エンジンや、人によるデータ目視検査によって、データをすぐに活用できる形にします。
データ分析を手軽にできるようにサポート
収集されたデータは適切な形で活用されて初めて価値を生みます。収集されたデータと貴社が所有しているデータや関連システムを有機的につなぎこむことで、データの持つ価値を最大限に発揮させることができます。
集計分析やグラフ化といった一般的なデータ可視化をはじめ、既存データとの名寄せ処理、貴社システムへのデータの投入など、収集されたデータが成果を出すところまでをサポートします。
システム運用はプロにおまかせ
取得Webページの対象拡大や、取得サイトのリニューアル、投入先システムの仕様変更など、データを扱うシステムの運用には継続的なコストや手間がかかります。
datistでは、提供するシステム全般の運用までをご提供しますので、運用の手間を一切気にすることなく、データ活用を継続することができます。
datistが選ばれる3つの理由
Webデータの取得が
機械学習で簡単に
datistのWebクロールエンジンは、これまで10億ページを超えるWebクローリングの実績により開発された、Web情報収集エンジンです。
機械学習と自然言語処理により、取得先サイトの構造を自動で解析、取得。そのため新たな開発を行うことなく、低コストで必要な情報を収集することができます。
システム+アナログで
精度の高いデータ加工
機械学習や自然言語処理を活用してデータの正規化やクレンジングを低コストで実現していますが、システムだけでは高いデータ精度を実現できません。
datistでは、データ加工の最終工程で、人の目による目視検査を行うことで、より精度の高いデータ加工を実現します。
スピーディで低コストな
貴社専用データ基盤構築
競合調査、市場調査、顧客データ構築、営業リスト、メディアコンテンツなど、収集されるデータの活用先は様々ですが、その目的や貴社の状況によって、最適なシステムや運用の形は違います。
datistでは、データ運用に必要な高度な機能をパーツとして組み込んで、貴社専用のデータ基盤を、スピーディーに低コストで構築、運用することが可能です。
お客様の声
SNSのコメントチェック機能の開発
自社SNSに投稿された不適切なコメントに素早く対処するために、datistによるWebクローリングとデータチェック機能構築、運用をお願いしました。
それまで人の目で都度チェックしていたものを自動化することができ、対応コストを削減できたほか、問題のあるコメントに素早く漏れなく対処することができるようになり、企業イメージの維持向上に役立っています。
民泊サイト宿泊価格とコメント調査
自社で運営している民泊施設のマーケット情報を提供するWebメディアに、掲載するデータコンテンツを作成するシステムをお願いしました。
複数の民泊サイトから宿泊価格やコメント情報などを日次で収集し、データコンテンツとして加工、メディアシステム側へデータ投入するまでを自動で行うことで、メディア運営のコストを大幅に削減することができました。
賃貸情報サイトのクローラー開発
不動産情報のまとめサイトを構築するために、既存賃貸情報サイトのクロールエンジンの開発やデータ加工、他システムとの連携プログラムの開発をしていただきました。
取得が難しいと言われていた複数の賃貸情報サイトのWebクロールエンジン開発を、2ヶ月という速さで納品。またサイト改変に伴うクロールエンジンの修正も迅速にやっていただけるので、データ取得の抜け漏れがなく大変助かっています。
医療系論文クロールエンジンの開発
医療従事者向けの論文検索サイトを構築するために、PubMed(パブメド)などの医療系論文の集まる検索サイトと、ニュースサイトのWebクロールエンジンの開発を依頼しました。
またクロールエンジンの開発だけでなく、インフラ環境へのシステム構築を行うことで、週次でデータ取得を行うシステムの運用が可能になりました。
事前に項目定義やサンプルデータをすり合わせすることで、こちらの希望通りのデータが提供されてます。開発から運用までワンストップでやってもらえるので、安心してお任せしています。
プラン
不動産/民泊プラン
新築、中古、注文住宅の売買・賃貸や民泊の不動産物件数や価格を定期的に取得し、データベース化します。
データを可視化することで不動産/民泊のマーケット分析をはじめ、地域・カテゴリーごとの販売価格、家賃、物件数などを定点観測をすることができます。
飲食店/美容室プラン
飲食店や美容室など店舗情報をクローリングします。
エリアごとの物件数や物件ごとの席数や単価、新規出店情報などの情報を元にエリアポテンシャルの推定が可能です。
また店舗のクチコミや求人情報を付与することで、より精度の高いターゲットリストの作成が可能となります。
ニュースメディアプラン
キュレーションサイトを構築するために必要なニュースメディアからの情報取得を自動化します。
引用元メディア、タイトル、公開日時、本文など情報を取得したのち、自動で記事の分類を行い、誰でも簡単にキュレーションサイトを構築することができます。
論文プラン
論文や特許情報を定期的に取得し、データベース化します。
新しい技術や研究のトレンドを把握をしたり、技術をもとにした大学・企業間のつながりを分析したりすることが可能です。
オークションプラン
オークションサイトの情報をクローリングし、商品情報をストックしていきます。
商品のカテゴリーや価格、入札件数、入札履歴、期日をデータ化することで、価格相場を把握することができるため、自社商品の価格戦略立案に活用できるデータとなります。
求人情報プラン
中途採用、新卒採用、アルバイト・パート採用などの求人メディアや派遣会社、人材紹介会社のオウンドメディアから求人情報を収集します。 今まさに採用している企業の営業リスト作成やエリア・職種ごとの求人動向の分析に活用することができます。(詳しくはこちら)
ソーシャルメディアプラン
SNSの投稿やコメントを収集・蓄積することで、投稿数の分析、NGワードのチェックなど、SNS運用におけるマーケティングやリスクマネジメントをサポートします。
AIを活用した投稿やコメントのネガポジ判定、またバイラル(口コミ)の広がり方の分析も可能ですので、マーケットの「見える化」も実現できます。
ファイナンスプラン
株価や出来高などの株式市場の動向や、企業IR情報を、定期的に取得し、データベース化ができます。
金融マーケットとしての情報分析のほか、自社の顧客データベースと組み合わせることで、与信管理や新規顧客開拓のターゲットリストへの活用などが可能です。
ECプラン
自社や競合商品の価格、在庫といった情報取集のほか、ECサイトや検索サイトでの検索順位なども収集することで、ECにおける自社製品のマーケット状況をリアルタイムに、一元的に把握できます。
収集した結果に応じて随時で価格変更を行うことで、ダイナミックプライシングの自動化を実現します。
スクリーンショットプラン
指定したWebサイトの見たままの状態を、スクリーンショットとして定点的にストック、時系列でのデータベース化が可能です。
各種ブラウザやスクリーンサイズを指定したデータ取得、変更があったタイミングのみの保存も可能で、画像サイトや動的なサイトの情報分析、自社サイトの不具合確認などに活用できます。
ブログ
【2021年】 データサイエンティストの給与は●●円?5年間の求人データから読み解く人材需要の推移
2021.04.05
2016年~2021年の5年間に出稿された求人情報を集計して、データサイエンティストの求人数や募集給与の推移をレポートにまとめました。
スマホアプリランキングから分析するモバイルゲームの将来性
2021.03.22
アプリランキングを幾つかの基準に分析し、アプリゲームがゲーム業界に与える影響やゲームコンソールとして未来も使えるのかを分析しました。