📷
読み込み中...
🎯主要機能
カメラ撮影でワンタップスキャン
スマホのカメラで書籍のページを撮影するだけ。OCR不要でAIが直接画像からテキストを認識・解析し、コンテンツを正確に抽出します。複数ページの連続スキャンにも対応。

AIがポッドキャスト風台本に自動変換
Gemini AIが書籍の内容を解析し、ラジオのトーク番組のように聴きやすい台本に自動リライト。重要なポイントを強調し、聴くだけで内容が頭に入る構成に仕上げます。

高品質な音声プレイヤー
自然な日本語音声で台本を読み上げ。再生速度調整、章ジャンプ、バックグラウンド再生に対応。MP3エンコードでオフラインでも聴取可能なPWA設計。

⚙️技術的詳細
Gemini Vision API
画像からのテキスト認識とコンテンツ解析をGemini APIのマルチモーダル機能で実現。OCRライブラリ不要で、書籍の写真から直接AIが内容を理解し台本化します。
Web Speech API + lamejs
ブラウザネイティブのSpeech Synthesis APIで日本語音声を合成し、lamejsでMP3エンコード。サーバーサイドの音声合成APIコストをゼロに抑えながら高品質な音声を実現。
PWA対応 & オフライン再生
Service Workerによるキャッシュ戦略でオフラインでも音声再生可能。ホーム画面追加でネイティブアプリライクな体験を提供。通知機能で新章追加を告知。
Supabase Auth & Storage
Supabaseの認証機能でユーザー管理、Storageで生成音声ファイルを安全に保管。RLS(Row Level Security)でユーザーごとのデータアクセスを厳密に制御。
💼活用シーン
通勤・移動中のビジネスパーソン
電車やバスでの移動時間を読書時間に変換。ビジネス書や自己啓発書のエッセンスをポッドキャスト感覚でインプットできます。
家事・育児中のパパ・ママ
料理や掃除、子どもの世話をしながら「ながら読書」。手が離せない時間も学びの時間に変わります。
学生の試験対策
教科書や参考書のページを撮影して音声化。繰り返し聴くことで記憶の定着率がアップ。散歩中やジョギング中にも勉強可能。
📖ストーリーで見る
お客様編
開発編
👤担当領域
🛠️使用技術
✨ハイライト
カメラ撮影→AI台本化→音声合成のワンストップフロー
ポッドキャスト風の聴きやすい台本にAIが自動リライト
章ごとの管理とフィード機能で継続的に聴ける
MP3エンコード対応でオフライン再生も可能
PWA対応でホーム画面からネイティブアプリのように起動
Supabase認証でユーザーごとの書籍ライブラリを管理
😰課題・問題
- ✗読書の時間を確保するのが難しい現代社会
- ✗移動中や家事中は本を手に取れない
- ✗オーディオブックは高額でラインナップが限られる
💡解決策
- ✓カメラで撮るだけで音声化し「ながら読書」を実現
- ✓ポッドキャスト形式で通勤・家事・運動中でもインプット可能
- ✓既存の紙の書籍をそのまま音声化でき、コンテンツの制約なし
🎯成果・結果
読書の「時間がない」問題を音声で解決
スキマ時間を学習時間に変換する新習慣を実現
1冊あたりの読了率を大幅に向上