機械学習を武器にOpenWorkのジョブマーケットへの船出を牽引したい

九州大学大学院 数理学府数理学専攻修士課程修了
PROFILE

2010年3月大学院修士課程修了後、日立製作所でSEとしてプロジェクトリーダーの経験を積む。その後医療系ITベンチャーにてCMSサービスやスマートフォン向けアプリケーションの開発・保守に従事し、中国・大連とのオフショア開発のマネジメントを担う。OpenWorkへ入社後は、数学の知識やこれまでの経験を生かしてKPIレポートの作成や評価スコア算出アルゴリズムの改善、機械学習のプロジェクトを担当。

使用している主な言語・技術
Python, MySQL, GitHub, Airflow, Tableau, TreasureData, Google Analytics, scikit-learn, Presto, TensorFlow, Keras

金融系システム開発やオフショア開発のプロジェクトリーダーを歴任

学生時代は数学を専攻し、大学院で整数論という分野を研究していました。修了後は日立製作所にSEとして入社。プロジェクトリーダーとして金融機関向けシステムの開発プロジェクトなどに携わりました。この時データベースなどのIT技術や、プロジェクト管理の基礎を学びました。

そのうち、自分の手でサービスを開発したいという思いが強くなり、歯科医院などにCMSサービスを提供している医療系ITベンチャーへ転職。日本人だけでなく、中国のエンジニアたちとも協力し、自社Webサービスや、スマートフォンアプリの開発と保守を担当しました。この会社では最新技術の取り込みが非常にはやく、仕事で触れるうち、最新のクラウドサービスやオープンソースの技術にひかれていきました。勉強熱心な同僚たちの影響を受け、社外のセミナーや勉強会へどんどん参加するようにもなりました。

数学のバックグラウンドもエンジニアとしてのキャリアも活かせるデータサイエンティスト

データサイエンティストの写真

次々と登場する新しい技術を学ぶうち、社会的に盛り上がりを見せていた機械学習の技術や、データサイエンティストという職業に関心を持つようになりました。中でも仕事に応用できそうだと考え、自然言語処理の技術を中心に幅広く学びました。他にも社内のビジネスコンテストで、CMS商材へのAIの活用を提案して賞をいただいたり、Bluetoothと加速度センサーを使用したIoTプロダクトのプロトタイプを作成したりと、新規ビジネスを考える機会もいただきました。しかし、この時は残念ながらいずれのプロジェクトも実用化に至らず、挫折感も味わいました。

こうした経験から、データ分析や機械学習は、学生時代に専攻していた数学のバックグラウンドやエンジニアとしての経験を活かせる領域だとわかり、思いきってデータサイエンティストとして転職する決意を固めました。

データに対して誠実な会社で、膨大なテキストデータを分析したい

OpenWorkを選んだ一番の理由は、このサービスは必ず世の中の役に立つという確信があったからです。2つの会社を経験しましたが、それぞれ社外からはわからない社風や文化があり、働きがいは企業規模や知名度によらないことを実感していました。また、自然言語処理に興味を持っていた自分にとって、業界では国内最大規模のクチコミデータを保有していることも非常に魅力的でした。

データに対して誠実だということも、決め手の一つでした。創業者の増井が「データドリブンな組織にしたい」という方針を掲げており、社内ではすでに2人のデータサイエンティストが活躍していました。どこまでもユーザーファーストで、サービスに対して真剣な会社。機能やデザインの変更がユーザーにとってほんとうに有益かどうか、必ずABテストでデータを取り検証をしています。この会社なら、データを大切にしてくれると感じました。

その後OpenWorkへの転職が決まってからデータサイエンティストとして必要な勉強を改めてやり直し、機械学習や統計学の本を何冊も購入。忘れかけていた微分積分や線形代数も急いで復習しました。

入社して驚いたのは他のデータサイエンティストのレベルの高さです。データの蓄積や可視化の基盤が想像以上に整えられており、ユーザーの行動分析や施策の評価に高度な統計モデルが活用されています。統計モデルを使用したアドホックな分析に関しては、私もこれからもっと勉強していきたいですね。

クチコミの審査やレコメンドに機械学習を導入、より有益なサイトへ

データサイエンティストの写真

今手がけているのは、クチコミ審査に機械学習を活用するプロジェクトです。OpenWorkではユーザーから寄せられたクチコミを目視で審査し、誹謗中傷やビジネスマナーに反するクチコミなどは非公開にしています。近年は訪問者数もクチコミの数も増加しており、より効率的に、高い品質でチェックすることが急務になっています。そこで機械学習の技術を活用し、的確に公開/非公開の判断ができるよう指標を算出しています。今後はもっと精度をあげて、自動化できる範囲を広げていきたいと考えています。

また、クチコミの情報量の多寡を判定する方法も検証しています。かつてはクチコミを増やすことが喫緊の課題でしたが、最近OpenWorkサイトは大規模化してきており、企業によってはクチコミが1000件を超えるケースもでてきました。その中で、ユーザーがすべてのクチコミを読みきれないという新たな課題も明らかになってきました。そこで有益な情報が含まれるクチコミを判定できるようにすることで、ユーザーが効率的に企業を比較し、よりよい企業と巡り合えるサイトへと進化させたいと考えています。サービスのフェーズが変わるごとに、解決すべき課題は刻々と変化します。常に新しい技術をキャッチアップしながら、現状の課題をすばやく見極め、サービスの変化に対応しなければなりません。

今後は「クチコミを見て、求人情報を探し、応募する」までをOpenWorkサイトで完結することをあたりまえにしたいですね。そのための武器として自分のスキルをフル活用し、ジョブマーケットにドラスティックな変化を起こしたいと思います。