Serverless Operations, inc

>_cd /works/id_cm6e_yrqi63

title

リスキルにより社内から登用したIT人材がAI議事録ツールを内製、戸田建設が取り組むDXを人材育成から支援

og:image

client

戸田建設株式会社

戸田建設(株)は、高層ビルの建設からトンネルなどの土木事業まで幅広く手がける建設会社です。1881年に創業した141年以上の歴史を持つ業界大手であり、近年では再生可能エネルギー事業を手がけるなど、先進的な取り組みも行っています。

summary

  • 戸田建設のDX推進室が取り組んだAIによる自動議事録ツールの内製をサーバーレスオペレーションズが支援
  • DX推進室メンバーがAIシステムのPoCに自ら挑戦、WhisperとGPT-4など複数AIモデルを活用したシステムの開発に成功
  • 内製化の取り組みとAI関連の開発をさらに推進、Stable Diffusionを使った建築パースの自動生成に取り組む予定

はじめに

戸田建設は、140年以上の歴史を持つ老舗の大手建設会社です。免震・制振技術や環境配慮型建築などの技術力に定評があり、国内のみならずアジアを中心に海外でも多くのプロジェクトを手がけています。近年は、デジタル技術の活用にも注力しており、ビルディング・インフォメーション・モデリング(BIM)や、AI、IoTなどを活用した建設プロセスの効率化に取り組んでいます。

同社のITへの取り組みで特徴的なのは、社内でクラウドネイティブなIT人材を育成し、その人材によって様々なITシステムの内製化に取り組んでいるところです。多くの企業がデジタルトランスフォーメーションを目指すものの、そのための人材確保に苦労しているなか、戸田建設では社内から希望者を募り、専門的な教育課程を経た上でIT部門に配属しています。

その部署の取り組みの幅は広く、建築・土木などの現場における効率化から、AIを活用した社内ツールの作成まで、様々な領域において自ら開発しており、サーバーレスオペレーションズでは、以前からDX推進室の内製化に向けた取り組みに対して、様々な支援を行ってまいりました。

こうした戸田建設の取り組みと、私たちの支援が実を結んだ成果のひとつとして、AIを活用した自動議事録作成ツール「Make-Minutes」があります。このツールは、DX推進室メンバーの個人的な興味から始まり、最終的には業務効率化のためのツールとして社内で広く使われるようになりました。

Make-Minutes

「Make-Minutes」開発の背景や、同社の内製化推進に向けた取り組みの状況について、開発を主導した同社DX推進室の平林 亮様、およびDX推進室室長の佐藤康樹様にお話しをうかがいました。

左から戸田建設の佐藤さん、平林さん

――戸田建設の社内で内製化したという自動議事録作成ツール「Make-Minutes」は、どのようなツールでしょうか?

平林 ブラウザベースのウェブアプリケーションになっており、音声ファイルをアップロードすると、音声認識AIが自動的に文字起こしを行い、その内容をLLMが整理、要約してテキストファイルの議事録として出力してくれます。

議事録の内容は、議題ごとの議論の内容をサマリーしたものと決定事項、それにともなう次のアクションも記述します。あらかじめ定めた議事録のフォーマットに揃えて出力しているので、一見しただけではAIによる自動作成とは分からないほど、議事録として完成したものを出力することができます。

人間が行わなければならない作業は、音声ファイルのアップロードと、会議の名称、日時、場所、参加者を入力することだけ。最短なら、2クリックで議事録を作成できます。音声認識による文字起こしデータも、閲覧したり編集したりできます。不要な部分をトリミングしたり、反対に特定の部分だけを切り出すといった使い方も可能です。

会議情報入力画面
議事録作成中画面
完了画面

――「Make-Minutes」は、AWS上で開発したそうですが、具体的にどのような内部構成になっていますか。

平林 構成としては、アップロードした音声ファイルをAmazon S3上に格納し、そのファイルをWhisperまたはAmazon Transcribeのどちらかの音声認識モデルによってテキスト化したデータがS3に保存されます。

そこからStep Functionsによってプロセスが起動され、大規模言語モデル(LLM)のGPT-4でテキストを要約したり整形したりして、最終的に議事録として出力されます。これらはすべてAWS上でサーバーレスとして構築しているので、インフラのメンテナンス等は不要です。

AWS構成図
AWS構成図

Make-Minutesでは要約に利用しているGPT-4oはOpenAI APIを、その他についてはAWS Bedrockを経由しており、音声認識モデルは、Amazon TranscribeかWhisperを、利用者が選べるようにしています。前者を選ぶと話者分離が可能で、後者だと話者分離はできないですが認識精度が高く、処理速度も速いです。例えば1時間の音声ファイルなら、Amazon Transcribeだと15〜18分、Whisperだと約3分ほどで文字起こしが作成されます。

高度な設定画面

そうやって文字起こしをしたものをOpen AIが開発したLLMのGPT-4によって要約して、議事録として成形しています。要約の際には、会議の内容や性質に合わせたプロンプトを、テンプレートとしていくつか用意しており、それを利用者が選択します。

デフォルトでは汎用的なテンプレートになっており、それでほとんどの会議はカバーできますが、例えば議題が明確な場合の会議であったり、自由な発想や意見を出すことが目的のワークショップだったり、プロジェクト開始時のキックオフミーティングであったりなどは、専用のテンプレートを用意しています。また、ユーザーが必要に応じて自分でプロンプトを組むことができるようにもなっています。

高度な設定画面

また、カスタムボキャブラリー辞書という機能も用意しており、建築・土木の専門用語や社内用語などを辞書ファイルとして設定しておくことで、音声認識の精度を高める事ができます。

左から戸田建設の佐藤さん、平林さん

――開発自体はすべて社内で行ったとのことですが、どういった経緯で自動議事録作成ツールの開発にいたったのでしょうか。

平林 元々AIについては興味を持っていて、何かやってみたいと思っていたので、2023年の4月頃から個人的なPoC(Proof of Consept=概念実証)として開発を始めて、6月にプロトタイプとして完成しました。このプロトタイプを部署や社内で公開したところ、面白い試みだと評価していただけました。

この頃は自分自身の勉強のつもりだったので、開発も自分で調べたり、ChatGPTに聞いたりしながら、基本的にはひとりで開発していました。プロトタイプを公開してからも、ひとりで少しずつ改良を進めていたのですが、2023年12月に他部署から機能追加の要望があり、そこからその部署と共同プロジェクトとして、本格的に業務として開発がスタートしました。

まずは、要望があった文字起こしのプレビュー機能などを実装したものをバージョン1.0として2024年1月に公開しました。この当たりから、サーバーレスオペレーションズさんにも相談するようになって、いろいろなアドバイスをいただきながら開発を進めていました。

2024年5月にはメンバーも4人に増えて、現在は私がリーダーとなってチームで開発を進めています。この8月にはUIをより使いやすく一新したバージョン2.0を公開したばかりです。今も開発は継続していて、現在は文字起こししたテキストデータの活用を検討していて、RAGを導入してチャットで会議の内容について質問できる機能を開発しているところです。

これまでに社内で数百名のかたに使っていただいて、ときおり社内からのフィードバックをいただいて改善に役立てています。

――個人的なPoCからスタートしたとのことですが、そうした業務ではないところから開発がスタートすることがあるんですね。

平林 そもそもプロトタイプを開発したきっかけは、2023年初頭に生成AIが大々的なブームになり、各AIベンダーがAPIの公開を始めていたので、それを見た佐藤室長がWhisperを使った議事録ツールのアイデアを部署内のWikiに投稿されたことだったんです。

そのアイデアは、システム構成がフローチャートになっていて、これはすごいなと思ったんです。自分でも考えていたのですが、なかなか構成を形にできずにいたので、この佐藤室長のアイデアに飛びつきました。

最初は、APIを叩いて音声ファイルの文字起こしが実際にできるのか試してみたら、非常にきれいな文字起こしデータができたんですね。これなら、最低限のユーザーインターフェイスを作成すれば、すぐに使えるツールになるんじゃないかと考えて開発を始め、完成したのが2023年6月でした。

戸田建設の佐藤さん

佐藤 当時はOpenAIのChatGPTがきっかけとなって、生成AIの大ブームが起きていました。私自身も非常に面白そうだなと思って、自分でいろいろと触っていました。

そうしているうちに、私たちは開発部門ですから、自分達で開発するとしたらこんな風にできそうだと思いついて、システム構成を図に書いて部署内のWikiに投稿したんです。これを見た誰か社員が、やってくれたらいいな、くらいの気持ちで投稿したのですが、そうしたら見事に平林さんが手を挙げてくれたんです。

こうした開発は、業務命令でやらせるよりも、自分でやりたいと思って取り組む方がモチベーションが高くなります。だから、指示はしたくなくて、誰かがやってくれたらいいな、くらいの気持ちでだったんですが、それに対して平林さんが期待以上の動きを見せてくれました。

平林 私はDX推進室の異動前はずっと事務系の部署にいたため、議事録を作成する機会が多かったんですね。だから、その時間を短縮したら、もっと効率的に働けるんじゃないか、という思いがずっとありました。

LLMが登場してから、いくつもAI議事録ツールが出回り始めたんですが、実際に業務で使えそうな機能を持ったものは、まだまだ高額なため、試しに導入しましょう、とは言いづらかったんです。

そこにWhisperのAPIが出てきたのを見て、これほど高性能なAIを使ってクラウド上で開発できるなら、自分でも議事録ツールが作れるかもしれないと考えていたところ、ちょうど良いタイミングでに佐藤室長が具体的なアイデアを出していただいたので、飛びついたんです。

――2023年6月に公開した最初のプロトタイプはひとりで開発したとのことですが、スムーズに行きましたか?

平林 AIを利用する機能自体は、シンプルなAPIの仕様なので、ほとんど苦労しませんでした。それよりも、UIとなるフロントエンドの構築の方に苦労しました。プログラミングに関しても、ChatGPTなどに質問することで解決しました。

また、ChatGPTにも聞いて分からないことは、DX推進室ではサーバーレスオペレーションズと定期的にミーティングの場があったので、そこで相談しました。Step Functionsを使った処理フローの構築についてや、音声認識モデルもAmazon Transcribeを使うことで話者分離が可能だというのも、金さんに教えていただきました。

使いやすさを意識したUI

 2024年1月頃にMake-Minutesの開発が本格化したころから、多くのご質問をいただくようになり、定例のミーティングの他、Slackでも随時コミュニケーションを取っていました。

AIに関する開発については、複数のAIモデルを組み合わせたシステム開発の参考実装をご紹介したほか、精度を改善するためのプロンプトについては、平林さんと工夫しながら一緒に詰めていきました。

――平林さんは、これまでこうしたAIやクラウドでのシステム開発を行ってきたんですか。

平林 私がDX推進室に異動になったのは2021年10月で、プロトタイプの開発時点で2年弱が経過してました。以前の部署は事務系で、それまでITについては専門的に学んだことはなく、DX推進室に異動してからの2年弱でプログラミングについて学び、AIを使った開発ができるまでになりました。

DX推進室では、サーバーレスオペレーションズさんに内製化支援をお願いしており、定期的にミーティングを行ったり、Slackで随時コミュニケーションすることができる環境で、そのおかげで成長することができました。

また、生成AIが登場してからは、簡単な質問は生成AIにすることで、さらに学習のスピードが上がりました。人間が相手だと、レベルの低い質問をするのに躊躇してしまいますが、AIが相手ならいつでも、どんな内容でも気にせずに質問できます。その点は、良い時代になったと実感しています。

もちろん、高度な内容だったり、AIが情報を持たない最新の内容だとAIには応えられません。そういう内容については、サーバーレスオペレーションズさんに聞くことで、非常に効率よくAIシステムの開発を学ぶことができました。

 私たちとしては、どんな簡単なご質問でも遠慮なく聞いていただいて、まったく問題ないのですが、人間ですから躊躇する気持ちも分かります。ただ、平林さんをはじめ、DX推進室の皆さんがどんどんと学ばれて行くので、質問自体もどんどんと高度で、より複雑な内容になっていくのを確かに実感しました。

私たちは内製化支援に当たって、例えばslackでいただいた質問には迅速に応えるようにしています。それでも、どうしてもタイムラグは発生しますが、簡単な質問は生成AIに聞いていただき、それでは分からないようなことは、私たちに聞いていただくという流れになったことで、皆さんの学習速度がより速くなったと感じています。戸田建設さんでは、こうした非常に良いサイクルを確立されています。

佐藤 弊社では、ITを専門的に学びたい社員に対して、大学で学べるプログラムを公募で実施しています。日常業務を行いながら同時に専門教育を受けるため、かなりハードルが高いプログラムで、これを修了した社員のなかから成績が良いメンバーをDX推進室にスカウトしています。だから、この部署のメンバーは皆、ITについて自ら手を動かし、学ぶことに対して、非常にモチベーションが高いんです。

左から戸田建設の佐藤さん、平林さん

――今後、DX推進室ではどういった開発を予定していますか

平林 私が手がけているものでは、BIM(Building Information Modeling)のデータを活用した建築パースのAIによる生成があります。BIMとは、建物の構造や材料、各部署の仕様や性能、部材の価格など、建物に関わるあらゆる情報を統合した上で、3次元モデルとして見える化する仕組みのことです。

このデータを使い、建物の完成予想図である建築パースを、画像生成AIであるStable Diffusionを使って描くことに挑戦しています。以前はそうした建築パースは、設計図を元に人間が描いていましたが、現在は3D CADのデータを元にしたCGが主流となっています。

それをさらにStable Diffusionを使うことで、天候や季節を変えたり、実際に人間が建物にいるといった、さまざまなシチュエーションのパースを短時間で作成することに挑戦しています。

これが実現すれば、例えばお客様との打合せにあたって、外壁の色を変えた際に、様々な状況での実際の見え方をリアルタイムでシミュレーションするといったことができるようになります。

 一般的な事業会社での生成AIの取り組みの多くはLLMが中心ですが、Sutable Diffusionを始めとした画像生成の取り組みも増えてきました。

AWSでもStable Diffusioの最新バージョンとなるStable Diffusion 3 Large、Stable Image Ultraが、一部のリージョンで使えるようになったことから、今後はさらに画像生成に関する企業の取り組みは増えていくでしょう。

ただし、業務レベルで生成AIをAWS上で利用するためには、現時点ではいろいろな工夫やノウハウが必要となります。そうした面で私たちがお手伝いできることが多いと思います。

堀家 戸田建設さんの内製化とAIへの取り組みは、私たちがご支援している企業のなかでも、かなり理想的に進んでいる企業のひとつです。

アイデアを出し、形にして、実際に使ってもらい、そこからのフィードバックによって、更に改良していくイノベーションのサイクルは、クラウドとサーバーレスの活用でさらに加速することができます。戸田建設さんでは、そのモデルが非常に上手くいっています。

なかでも、人的リソースについては多くの企業が悩んでいるところですが、それについても社内からのリスキルによる登用だけでなく、そうやって生まれた新たなIT人材がモチベーション高く手を動かせる環境作りも行っています。この取り組みには、私たちも支援によって貢献できているだけでなく、私たち自身も学ぶところが非常に大きいと感じています。

Back
to list
<-