スクレイピング(1.SageMakerノートブック(Python)でWeb情報ダウンロード)
前提
SageMagerノートブックインスタンスが作成済みであること
実践!
1.SageMakerノートブックインスタンス起動
1-1.AWS - SageMaker - ノートブック
1-2.conda_python3でインスタンスを起動
2.Web情報ダウンロード
2-1.下記を実行し、Web情報がダウンロードできることを確認
import requests url = "https://xxx.co.jp" # 取得したいサイトのURL response = requests.get(url) response.encoding = response.apparent_encoding print(response.text)
3.ファイルへ出力
3-1.下記を実行
filename = "download.txt" f = open(filename, mode="w") f.write(response.text) f.close()
3-2.「File」-「Open」
3-3.ファイルが出力されていることを確認