ChatGPTで営業リスト作成し放題!スクレイピング用プロンプトとコツ

ChatGPTを活用して、営業リスト作成を自動化しませんか?

面倒なデータ収集作業から解放され、より戦略的な営業活動に集中できるようになります。

この記事では、初心者でも実践できる、具体的なスクレイピング方法や、質の高いリストを作成するためのポイントをわかりやすく解説します。

目次

ChatGPTでスクレイピングして営業リスト作成する方法とプロンプト

ChatGPTとスクレイピングを組み合わせることで、効率的にターゲット顧客リストを作成できるようになります。

この章では、誰でも実践できる具体的なプロンプト例や、より効果的なリスト作成のコツを解説します。

営業リストの作り方①:WEBページをHTMLファイルで保存

営業リストを効率的に作成するために、まずはターゲットとなるWEBページの情報を取得しましょう。

最も簡単な方法は、WEBページをHTMLファイルとして保存することです。

以下の手順で進めてください。

STEP
保存したいページを開く

ターゲットとしているWEBページをブラウザで開きます。

営業リストとして有用な情報(企業名、連絡先など)が掲載されているページを選びましょう。

STEP
ページを保存

ページ上で右クリックし、「名前を付けてページを保存」または「Webページ全体を保存」といったオプションを選択します。

保存形式は「完全なWebページ」や「HTMLのみ」を選び、保存先を指定してファイルを保存します。

このHTMLファイルには、WEBページの構造やテキスト情報がそのまま保存されるため、後のステップでChatGPTを使って情報を抽出することができます。

営業リストの作り方②:HTMLファイルをChatGPTに読み込む

ChatGPTでは、HTMLファイルの内容を解析して特定のデータを抽出するプロセスが可能です。

これは、Advanced Data Analysisという機能で、元々コードインタプリターと呼ばれていた機能です。

機能の詳細は以下の記事を参照してください。

あわせて読みたい
ChatGPTのAdvanced Data Analysis(旧コードインタプリター)の使い方!データ分析やグラフ作成が可能 ChatGPTの進化は目覚ましく、今やデータ分析の強力なツールとなっています。 Advanced Data Analysis機能(旧コードインタプリター)を使えば、Pythonコードの実行や、様々なデータフォーマットの取り扱いが可能になりました。 本記事では、ビジネスにおけるデータ分析の課題解決に、この機能がどのように役立つのかを具体的に解説します。

以下のプロンプトを使って、保存したHTMLファイルを読み込んでください。

以下のHTMLファイルの内容から、企業名と連絡先(メールアドレス、電話番号)が記載されている部分を抽出して一覧にしてください。

このように指示することで、HTMLファイルから必要な情報だけをピックアップし、営業リストのベースとなるデータを集めることができます。

営業リストの作り方③:データ抽出のプロセス

ChatGPTは、HTMLの構造を解析し、特定のタグ(例えば、<a>タグや<span>タグ)を識別して、その中に含まれる情報を抽出します。

もし、複数のデータがある場合でも、ChatGPTはその内容を整理して出力することができます。

以下がプロンプト例です。

あなたはデータサイエンティストです。
添付したhtmlファイルを分析して、以下の企業情報をstepbystepで取り出してください。
・企業名
・企業概要
・業種
・住所
・従業員数

出力はCSVで行ってください。

上記のような指示を出すと以下のような結果が得られます。

ダウンロードしたCSVファイルは以下のように抽出していました。

営業リストの作り方④:データの整理とリスト化

最後に、抽出したデータを整え、営業リストとして活用可能な形式(例えばCSVファイル)で出力すれば、リストはそのまま営業活動に利用することができ、顧客管理ツールやメール送信ツールにインポートすることも容易です。

ChatGPTを利用することで、従来の手作業による情報収集に比べて、短時間で効率的に営業リストを作成することが可能です。

ChatGPTを使って営業リストをクレンジングする方法

営業リストは、顧客管理や営業活動に欠かせないツールですが、取得したデータが乱雑で、整形されていない場合、活用が難しいことがあります。

例えば、企業名の重複や住所のフォーマットの違い、電話番号やメールアドレスが抜けているなど、データの一貫性が欠けていると、効果的に活用することができません。

Excelの関数やマクロに慣れていない多くの人にとっては、このプロセスを手作業で行うのは非常に手間がかかり、時間を要します。

そんなときに役立つのが、ChatGPTを使ったクレンジング方法です。

ChatGPTを利用すれば、簡単な指示を入力するだけで、営業リストのデータを迅速かつ正確に整理することが可能です。

例えば、以下のようなデータがあったとします。

すべての情報がA列に集約されてしまって、データの分析がしづらいですよね。

以下のステップで順番にデータを整えることが可能です。

STEP
フォーマットの統一

住所の表記や電話番号のフォーマットがバラバラな場合も、ChatGPTに「住所のフォーマットを統一してください」や「電話番号の形式を揃えてください」「項目ごとに列を分けてください」と伝えるだけで、一貫したデータに整形できます。

STEP
欠損データの補完やエラー修正

欠損しているデータや誤った形式のデータを補完・修正することも可能です。

例えば、住所が欠けている場合、「住所が空白の行を特定し、目印を付けてください」と指示することで、修正が必要な箇所がすぐにわかります。

ChatGPTで営業リストを作成する場合の注意点

ChatGPTを使って営業リストを作成するのは非常に便利ですが、いくつかの注意点を理解しておくことが重要です。

特に、スクレイピングを行う際には、サイトの構造や利用規約を確認し、それに応じた対応を行う必要があります。

ここでは、具体的な注意点について解説します。

スクレイピングするサイトの構造によってプロンプトは変わる

スクレイピングを行う際、対象となるWEBサイトの構造はサイトごとに異なります。

そのため、ChatGPTに正確に情報を抽出させるには、適切なプロンプトを作成することが大切です。

例えば、あるサイトでは企業名が<h1>タグで表示されている一方で、別のサイトでは<div>タグに含まれている場合があります。

そのため、プロンプトを作成する際には、事前にHTMLの構造を確認し、「企業名が含まれているタグやクラスを特定してください」と指示する必要があります。

そしてタグが特定後、以下のようなプロンプトで抽出を指示します。

このHTMLファイルから、企業名を<h1>タグから抽出してください。
このHTMLファイルでは、企業名が<div class="company-name">の中にあります。そこから企業名を抽出してください。

また、サイトによっては動的にデータを生成している場合もあるため、そういったページでは単純なHTMLファイルの保存では情報が正しく取得できない場合もあります。

このようなケースでは、プロンプトのカスタマイズが特に重要になります。

利用規約でスクレイピングが禁止されていることがある

スクレイピングを行う際、必ず注意しなければならないのが、対象サイトの利用規約です。

多くのWEBサイトでは、スクレイピングやデータの自動収集が禁止されていることがあります。

これに違反すると、法的な問題に発展する可能性もあるため、事前にサイトの利用規約を確認することが必須です。

例えば、以下のようにAmazonではデータ収集が全面的に禁止とされています。

出典:Amazon.co.jp利用規約 – Amazonカスタマーサービス

特に、企業情報を集める目的で使用する場合、個人情報保護の観点からも注意が必要です。

ChatGPTを使っての情報収集は便利ではありますが、必ずルールに則った形で行うようにしましょう。

まとめ

ChatGPTを活用して営業リストを作成・クレンジングすることで、効率的にデータを整理・整形することができます。

しかし、スクレイピング対象のサイトの構造に応じたプロンプトの工夫や、利用規約の確認は必須です。

特に、スクレイピングが禁止されている場合、法的リスクも伴うため注意が必要です。

これらのポイントを押さえつつ、正確かつ合法的なリスト作成を進めましょう。

よかったらシェアしてね!
  • URLをコピーしました!
  • URLをコピーしました!
目次