あめがえるのITブログ

頑張りすぎない。ほどほどに頑張るブログ。

【AWS】スクレイピング(1.SageMakerノートブック(Python)でWeb情報ダウンロード)


スクレイピング(1.SageMakerノートブック(Python)でWeb情報ダウンロード)

前提

SageMagerノートブックインスタンスが作成済みであること

実践!

1.SageMakerノートブックインスタンス起動
1-1.AWS - SageMaker - ノートブック
1-2.conda_python3でインスタンスを起動

2.Web情報ダウンロード
2-1.下記を実行し、Web情報がダウンロードできることを確認

import requests
url = "https://xxx.co.jp" # 取得したいサイトのURL
response = requests.get(url)
response.encoding = response.apparent_encoding
print(response.text)


3.ファイルへ出力
3-1.下記を実行

filename = "download.txt"
f = open(filename, mode="w")
f.write(response.text)
f.close()

3-2.「File」-「Open」

3-3.ファイルが出力されていることを確認