Poison word e stop word sono uno degli argomenti sul web writing meno conosciuti e affrontati, almeno per quanto riguarda il nostro paese. Navigando in rete mi sono accorto che è quasi impossibile trovare un post o un articolo esaustivo: l’unica soluzione per capirci qualcosa è ritagliare qualche info qua e là, sia da forum che da siti in lingua inglese, wikipedia compresa. Spero quindi di aver fatto cosa gradita raccogliendo qui di seguito tutte le info a riguardo!
Cominciamo per prima cosa con una definizione grossolana (ma comoda) dei due termini: per poison word si intendono quelle parole che gli spider di Google considerano con sospetto.Qualcosa di simile si può dire delle stop word: qui la particolarità sta nel fatto che usare o meno queste parole, dal punto di vista degli spider, è del tutto indifferente.
A questo proposito en.wikipedia.org, con molte più voci della corrispondente it.wikipedia.org, dedica alle due formule altrettante definizioni, che qui di seguito riporto in una traduzione libera:
Parole veleno (o parole proibite): il nome dato a quelle parole o frasi che generano sospetto, sfiducia e perdita di rispetto, o risultano inappropriate per un dato sito web relativamente alla sua considerazione da parte dei motori di ricerca. Non esiste un elenco preciso delle parole veleno incluse dagli strumenti di elaborazione di linguaggio naturale. Le poison word sono diverse dalle innocue ma utili parole chiamate “stop word”.Parole adulte (oscene) possono far scivolare una pagina web in una categoria per adulti, dove la stessa pagina viene filtrata dai motori di ricerca. Queste parole rappresentano quindi un set di “parole veleno”. Alcuni ritengono però che qualsiasi parola in grado di abbassare il vostro ranking in un motore di ricerca sia da considerare come una “parola veleno”. Altre persone considerano le parole che incoraggiano gli annunci pubblicitari o attirano questi ultimi per guadagnare molto di più come “parole veleno”.
Questo discorso sembra valere ancora di più per gli annunci Google Adwords, nei quali ogni breve testo contenente una “poison word” viene immediatamente segnalato come inappropriato. A maggior ragione quindi, quando si scrive un profilo o la descrizione di un prodotto da inserire online, è bene fare attenzione anche ai dettagli. Pensate ad esempio a quanto si abusa della parola sexy… ripetetela troppe volte e avrete fatto la frittata.
A questo indirizzo ho recuperato una lista di poison word (anche se nel titolo si legge stop words) in lingua inglese. Fatte le dovute traduzioni, si intuisce facilmente quali possano essere gli argomenti banditi.
Tornando alle definizioni di en.wikipedia.org, ecco cosa si legge alla voce Stop words dell’enciclopedia:
Parole stop: parole che vengono filtrate prima o dopo il trattamento dati in linguaggio naturale (testo). […] Per alcuni strumenti si specifica di evitarne l’uso per favorire la ricerca per frase.Ogni gruppo di parole può essere scelto come le “parole stop” per un determinato scopo. Per alcuni motori di ricerca, queste sono alcune delle più comuni, brevi parole funzionali, come “il”, “è”, “che” e “su”. In questo caso, tali parole possono causare problemi durante la ricerca di frasi che le includono, in particolare con nomi come ‘The Who’, ‘The The’ o ‘Take That’. Altri motori di ricerca rimuovono dalle query alcune delle parole più comuni – tra cui parole lessicali come “voglio” – in modo da migliorare la prestazione.
Ed ecco, secondo il sito ranks.nl, la tanto agognata lista di stop word italiane:
a dello fino
|
ha hai hanno ho ilindietroinvece io la lavoro le lei lo loro lui lungo ma me meglio molta molti molto nei nella no noi nome nostro nove nuovi nuovo o oltre più
|
quasi quattro quello questo quiquindi quinto rispetto sarà secondo sei sembrasembrava senza sette sia siamo siete solo sono sopra soprattutto sotto stati stato stesso su subito sul sulla tanto te tempo terzo tra tre triplo ultimo un una uno va vai voi volte vostro
|
Credo (e spero) di essere stato abbastanza completo nel dare una definizione di poison word e stop word. Ammetto che qualche dubbio rimane… perché diavolo vengono considerate stop word parole come “consecutivo”, “persone” o “tempo”??? La tentazione di mettere alla prova Google con un post intitolato “il tempo consecutivo delle persone” è tremendamente alta………………
Tutte le novità sul mondo del content marketing (e non solo)
Vuoi sapere come si diventa copywriter? O come gestire un profilo Facebook? O dove intervenire per ottimizzare un testo SEO? Continua a leggere, questo blog è per te!
Centra i tuoi obiettivi
Se pensi che i nostri servizi possano aiutare il tuo business a crescere, o se vuoi una semplice consulenza per capire come muoverti, scrivi un'email all'indirizzo di posta info@contenuti-web.it. Non costa nulla, anzi: ti fa risparmiare!
Comments are closed.
Molto interessante. Il punto è che gli spider dei motori di ricerca hanno il tipico limite di tutte le macchine, ossia non hanno la nozione di contesto. Per questo è importante il concetto di web semantico, che porterebbe il contesto in primo piano. Se il sito è nel contesto della lotta alla droga, allora le parole elencate sopra sono IN contesto e quindi non ha senso penalizzare un sito per il suo contesto. In fondo quello che faceva Yahoo! all’inizio del web era molto più semantico dello scanning di contenuti degli spider: ossia, le directory, dunque un contesto per ciascun sito. Ottimo articolo. 🙂
E ottima anche la tua puntualizzazione Gabriele. Un dettaglio non da poco che hai fatto bene a segnalare, confesso che era in programma tra le cose da scrivere in questo post ma poi chissà come devo averlo scordato. Verissimo!
Grazie mille e alla prossima!