Spotify extraction: Unterschied zwischen den Versionen
Zur Navigation springen
Zur Suche springen
Zeile 1: | Zeile 1: | ||
= Pipeline = | |||
== Setup == | |||
input: | |||
# Playlist.html (von Spotify) | |||
# Playlist.html (von YouTube) | |||
load in python: | |||
# Playlist.html (von Spotify) | |||
-> | |||
# playlist_info | |||
# episodes | |||
## episode_info | |||
## episode_info | |||
## ... | |||
json | |||
-> | |||
=== Idee: Titel und Beschreibung aus Spotify extrahieren === | === Idee: Titel und Beschreibung aus Spotify extrahieren === | ||
Vorgehen: | Vorgehen: | ||
Zeile 13: | Zeile 34: | ||
Regex: | Regex: | ||
index=\d*" title=" | index=\d*" title=" | ||
Aktuelle Version vom 7. Dezember 2022, 16:37 Uhr
Pipeline
Setup
input:
- Playlist.html (von Spotify)
- Playlist.html (von YouTube)
load in python:
- Playlist.html (von Spotify)
->
- playlist_info
- episodes
- episode_info
- episode_info
- ...
json
->
Idee: Titel und Beschreibung aus Spotify extrahieren
Vorgehen:
- Seite speichern
- Vollständig runterscrollen (optional?)
- STRG+S -> An "Ort" speichern
- Seite editieren
- "Ort" mit Visual Studio Code öffnen
episodeTitle (?<=episodeTitle">).+?(?=<\/div>)
Idee: Auch für YouTube das tun
Regex:
index=\d*" title="