top of page
Rechercher

Visualizzazione del testo del libro "Via col vento" con Word Cloud !

  • Photo du rédacteur: Literature & Cie
    Literature & Cie
  • 4 mars 2021
  • 2 min de lecture

Dopo che il set di dati del libro "Via col vento" è uscito in Kaggle, come un drogato di narrativa storica ho dovuto lavorarci. Ho fatto una nuvola di parole con i dati di testo del libro già nel mio kernel chiamato « Francamente My Dear, I Just Want a Word Cloud ».


Darò una rapida panoramica su come utilizzare il pacchetto wordcloud di Andreas Muller in Kaggle per generare visualizzazioni in questo post.


Word Cloud

Word cloud è uno strumento di visualizzazione molto popolare e comune per mostrare le parole in base alla sua frequenza relativa o importanza in un testo. Il formato generale di una nuvola di parola tuttavia può essere abbastanza noioso, in modo da possiamo aggiungere le immagini della maschera per cambiare la figura.


In Kaggle, non possiamo scaricare le immagini delle maschere direttamente dal web, così ho dovuto creare un file zip contenente le immagini delle maschere che volevo provare e caricare su Kaggle come set di dati. Dopo di che sono stato in grado di provare diversi campioni fino a quando mi è piaciuto uno.


L'immagine maschera che mi è piaciuta di più è riportata di seguito. La scelta di una buona immagine maschera è la chiave per creare una visualizzazione cool. All'inizio ho scelto immagini con sfondo riempito invece di bianco e i risultati erano mediocri, invece di una forma ho ottenuto un'immagine al quadrato nonostante l'utilizzo di maschere.

Codice

Il pacchetto di Muller rende la generazione di nuvole di parole estremamente facile. Il codice è già autoesplicativo, ma aggiungerò una breve panoramica.


max_words è il numero di parole più frequenti che verrebbero incluse nella visualizzazione, mask è l'array numpy contenente l'immagine della maschera che ho caricato con Pillow, STOPWORDS sono l'elenco di parole comuni che non vogliamo includere perché non forniscono alcuna comprensione.


Possiamo anche controllare l'altezza e la larghezza del risultato, ma farlo non mi ha aiutato in questa visualizzazione. Probabilmente proverò presto ad analizzare i sentimenti.



 
 
 

Posts récents

Voir tout

Commentaires


Post: Blog2_Post

Formulaire d'abonnement

Merci pour votre envoi !

©2020 par Literature & Cie. Créé avec Wix.com

bottom of page