Spotify extraction
Version vom 7. Dezember 2022, 15:37 Uhr von Timborg (Diskussion | Beiträge)
Pipeline
Setup
input:
- Playlist.html (von Spotify)
- Playlist.html (von YouTube)
load in python:
- Playlist.html (von Spotify)
->
- playlist_info
- episodes
- episode_info
- episode_info
- ...
json
->
Idee: Titel und Beschreibung aus Spotify extrahieren
Vorgehen:
- Seite speichern
- Vollständig runterscrollen (optional?)
- STRG+S -> An "Ort" speichern
- Seite editieren
- "Ort" mit Visual Studio Code öffnen
episodeTitle (?<=episodeTitle">).+?(?=<\/div>)
Idee: Auch für YouTube das tun
Regex:
index=\d*" title="