プロのデータエンジニア水準の転送パイプラインを、
最短5分で本番デプロイ
プロのデータエンジニアが実務に必要なレベルの転送機能を準備しました。
連携先の多さや転送速度はもちろんのこと、可用性やスケーラビリティ、
更にはセキュリティまでが考慮された設計になっています。
GUESS ファイルの形式・スキーマを自動推論

転送元のデータがファイル形式の場合、troccoはファイルの圧縮形式・フォーマット・スキーマ(データ型)等を自動で推論します。
そのため列名を手動で入力したり、各列のデータ型を入力する手間が省け、非常に効率的に作業を行うことが出来ます。
SCALABILITY スケーラビリティの考慮されたインフラで、高速化や同時並列実行も問題なし

高速化オプション
CPUs/Memoryの割り当てを自由にお選びいただけるため、厳しいパフォーマンス要件にも対応できます。

スケーラビリティ
Kubernetesクラスタ内で自動スケールアウトするため、多数のジョブ同時実行に耐えられます。
SPEED 転送処理エンジンには、パワフルな「Embulk」を採用

trocco(トロッコ)ではデータ転送のエンジンに、データ転送に特化したOSSである「Embulk」を採用しています。
そのためビッグデータ規模のデータも高速かつ安定して転送が可能です。
EmbulkのOSSにはtroccoの開発チームもコミットしており、何かあっても対応が可能です。
すでにEmbulkをお使いの方は、
サーバレス版としても

インフラ管理が不要
インフラはKubernetesクラスタ管理されており、Embulk実行のたびに専用のサーバ(コンテナ)が立ち上がります。可用性・スケーラビリティについて気にする必要がないうえに、CPUやメモリも必要な量をお選びいただけます。

画面で操作が完結
embulk guess/preview/runといったコマンドは、すべてtroccoの画面上で操作可能です。接続確認やカスタム変数など、Embulkをより便利にする機能も豊富なため、config.ymkを自分で作るよりも簡単で、作業効率が上がります。

接続情報の共有・権限管理
DBやAPIの認証情報は、設定とは別画面で保存するので使いまわすことができます。また、チーム内で共有することもできるため作業効率がアップします。権限も設定可能なので、運用時も安全です。