初期費用0 安心の月額定額料金14日間無料トライアル実施中

機能紹介

業界一速く、
高度なETLまで可能な
データ統合SaaS

手軽さだけではない「かゆいところに手が届く」機能がいっぱい。
エンジニアに必要な機能をゼロから考え直しました。
業界一の転送速度を誇り、ETLやEmbulkの詳細設定まで可能。
専門のデータエンジニアの方でもお使いいただけます。

転送方式

troccoはデータ転送に必要な「かゆいところに手が届く」機能を備えています。
しかも、業界一の転送速度でデータが転送できます。

選べる4つの転送方式

  • Embulkを転送エンジンに採用
  • ファイル集約転送機能
  • ファイルコピー転送機能
  • ローカルファイルアップロード

転送モード

【抽出】:全件転送はもちろん、Keyベースで増分データを判別する差分更新や、カスタム変数を使ったクエリなど、柔軟なデータ抽出が可能です
【転送】:全件洗い替え、追記、カスタム変数を使ったパス・テーブル名指定での転送が可能です
【リアルタイム】:転送は最短1分間隔で実行可能です

様々なファイルに対応

転送元や転送先にファイルをお選びになる場合、様々なファイル形式(CSV/JSON Lines/JSONPath/Avro/Parquet)や圧縮方式(Gzip/Bzip2/Lzo/Tar/Zip)への対応がございます。

高速な並列実行

データ転送を高速実行するため、4~32並列で転送を行います。その結果、業界一の転送速度を実現しています。

ビッグデータ規模に対応

最大3TBの巨大データの転送に対応しております(組み合わせによっては制限がある場合もございますので、詳細はお問い合わせください)

ETL

分析環境(DWH)に取り込む前に、必要な変換は全て完了します。troccoの設定を終えれば、あとは分析を行うだけです。

  • 行・列のフィルタリング
  • 値のマスキング・ハッシュ化・暗号化
  • 文字列の置換
  • Ruby/Python/Javaなど、任意の言語による変換

運用サポート機能

データエンジニアの目線に立ち、データの運用・可用性をゼロから考え直しました。
その結果、ただのジョブ管理だけではなく、データ運用に必要なサポート機能をご用意しております。

自動データ設定
転送元データのスキーマを自動で推論します。また、推論された結果を使えば、転送先DWHに自動でテーブルを作成できます。
データ件数アラート
ジョブが正常に実行された場合でも、転送したデータ件数でアラートを投げる事ができます。
転送時間アラート
ジョブが異常に長い時間実行されている場合、アラートを発信することができます。
ジョブ管理機能
通知、スケジュール実行、リトライ、重複実行防止など、ジョブ管理に必要な機能も充実しています。
Infrastructure as Code
全ての設定はJSONで出力可能なのでコード管理が可能です。またAPIから実行可能なので、Infrastructure as Codeを促進します。

Built with embulk

Embulkを自前でご利用中の方にもメリットがあります。
インフラやジョブ管理を考える必要はありませんし、すぐに移行が可能です。
config.ymlは全て画面で操作可能になるので、引き継ぎや属人化を気にする必要はありません。

サーバレス
インフラはKubernetesでクラスタ管理されており、Embulk実行のたびに専用のサーバ(コンテナ)が立ち上がります。可用性、スケーラビリティについて気にする必要は無い上に、CPUやメモリも必要な量をお選び頂けます。
画面で操作が完結
embulk guess/preview/runといったコマンドは全てtroccoの画面上で操作が可能です。接続確認やカスタム変数など、Embulkをより便利にする機能も豊富なので、config.ymlを自分で作るよりも簡単で作業効率が上がります。是非お試しください。
接続情報の共有・権限管理
DBやAPIの認証情報は、設定とは別画面で保存するので、使い回すことができます。またチーム内で共有することも出来るため、作業効率が上がります(権限も設定可能なので安全です)。
config.ymlインポート
既にEmbulkをご利用中の場合、config.ymlからのインポートが可能ですので、すぐにtroccoに移行できます。(Enterpriseプランのみの対応となります)
対応プラグインは50以上
主要なプラグインに対応しています(詳細はドキュメントページを御覧ください)。対応がない場合もご要望頂ければ、通常1~2週間で追加が可能です。

主要な対応サービス

まずは資料請求
まずは
資料請求