Perché alcuni siti web aggiungono “Slug” alla fine degli URL?

Molti siti web, incluso questo, aggiungono quelli che apparentemente sono chiamati slugs – descrittivi ma per quanto posso dire inutili frammenti di testo – alla fine degli URL.

Ad esempio, l’URL fornito dal sito per questa domanda è:

https://stackoverflow.com/questions/47427/why-do-some-websites-add-slugs-to-the-end-of-urls

Ma il seguente URL funziona altrettanto bene:

https://stackoverflow.com/questions/47427/

Il punto di questo testo è solo per rendere l’URL più facile da usare o ci sono altri vantaggi?

Le lumache rendono l’URL più user-friendly e sai cosa aspettarti quando fai clic su un link. Motori di ricerca come Google, classifica le pagine più in alto se la parola chiave è nell’URL.

L’usabilità è una delle ragioni, se ricevi quel link nella tua e-mail, sai cosa aspettarti. SEO (ottimizzazione dei motori di ricerca) è un’altra ragione. I motori di ricerca come Google classifica la tua pagina più in alto per le parole chiave contenute nell’URL

Recentemente ho cambiato il mio formato di URL del sito web da:

http://www.mywebsite.com/index.asp?view=display&postid=100

A

http://www.mywebsite.com/this-is-the-title-of-the-post

e ha notato che le percentuali di clic sull’articolo sono aumentate del 300% dopo la modifica. Certamente aiuta l’utente a decidere se quello che sta pensando di fare clic su è rilevante, in termini di SEO, anche se devo dire che ho visto poco impatto dopo il cambiamento

Sono d’accordo con altre risposte sul fatto che qualsiasi slug errata debba redirect 301 alla forma corretta. In altre parole, https://stackoverflow.com/questions/47427/wh dovrebbe redirect a https://stackoverflow.com/questions/47427/why-do-some-websites-add-slugs-to-the-end-of-urls . Ha un altro vantaggio che non è stato menzionato – se non si esegue un reindirizzamento a un URL canonico, sembrerà che si abbia un numero quasi infinito di pagine duplicate. Google odia contenuti duplicati.

Detto questo, dovresti preoccuparti solo dell’ID del contenuto e consentire qualsiasi input per lo slug finché si esegue il reindirizzamento. Perché?

https://stackoverflow.com/questions/47427/why-do-some- websites-add-slugs-to-end-of-urls

… Oops, il software di posta interrompe la fine dell’URL! Nessun problema però, perché è ancora ansible eseguire il rollover con https://stackoverflow.com/questions/47427

L’unico grosso problema con questo approccio è se si ricava lo slug dal titolo del tuo contenuto, come hai intenzione di trattare con titoli non ASCII, UTF-8?

È fondamentalmente una posizione più significativa per la risorsa. Usare l’ID è perfettamente valido ma significa più macchine che persone.

A rigor di termini, l’ID non dovrebbe essere necessario se lo slug è univoco, è ansible garantire più facilmente slug univoci osservandoli all’interno delle date.

vale a dire:

 /2008/sept/06/why-some-websites-add-slugs-end-of-urls/ 

Fondamentalmente questo sfrutta la bassa probabilità che due slug identici siano in uso nello stesso giorno. Se c’è uno scontro la convenzione generale è di aggiungere un contatore alla fine dello slug ma è raro che tu li veda mai:

 /2008/sept/06/why-some-websites-add-slugs-end-of-urls/ /2008/sept/06/why-some-websites-add-slugs-end-of-urls-1/ /2008/sept/06/why-some-websites-add-slugs-end-of-urls-2/ 

Un sacco di algoritmi di slug si sbarazzano anche di parole comuni come “il” e “un” per aiutare a mantenere l’URL breve. Questo approccio con scope rende anche molto semplice trovare tutte le risorse per un dato giorno, mese o anno: basta semplicemente tagliare i segmenti.

Inoltre, gli URL di stackoverflow sono negativi, nel senso che introducono un segmento aggiuntivo per caratterizzare lo slug, il che rappresenta una violazione dell’idea che ogni segmento dovrebbe rappresentare la discesa di una gerarchia di risorse.

Il motivo per cui molti siti lo usano è probabilmente SEO (Search Engine Optimization). Yahoo era solito dare una ragionevole ponderazione alla presenza della parola chiave di ricerca nell’URL stesso, e ha anche aiutato nel risultato di Google.

Più recentemente i motori di ricerca hanno abbassato la ponderazione assegnata alle parole chiave nell’URL, probabilmente perché la tecnica è ora più comune sui siti di spam che legittima. Le parole chiave nell’URL ora hanno solo un impatto molto minore sui risultati della ricerca, se non del tutto.

Per quanto riguarda lo stackoverflow, la SEO potrebbe essere una motivazione (le vecchie abitudini sono dure a morire) o semplicemente l’usabilità.

Il termine slug proviene dal settore dell’editoria / dei giornali. È un titolo breve che viene utilizzato per identificare una storia in corso. Le persone interessate alla semantica dell’URL hanno iniziato a utilizzare un titolo breve e abbreviato nei loro URL. Paga anche in SEO, poiché le parole chiave negli URL aggiungono importanza a una pagina.

Ironia della sorte, molti siti Web hanno iniziato a inserire una versione completa dei titoli nei loro URL con il termine serializzazione-con-trattini per scopi strettamente SEO, il che significa che il termine slug non si applica più. Questo mette anche alla prova i puristi semantici, poiché molte implementazioni attaccano questa versione serializzata del titolo alla fine dei loro URL.

Prendo atto che è ansible modificare liberamente il testo. Questo URL sembra funzionare altrettanto bene.

https://stackoverflow.com/questions/47427/why-is-billpg-so-very-awesome

Come già detto, lo ‘slug’ aiuta le persone e i motori di ricerca …

Qualcosa che valga la pena di notare, è che nella fonte della pagina c’è un url canonico

Ciò impedisce alla pagina di essere indicizzata più volte.

Esempio:

  

Rimuovi la formattazione dalla tua domanda e vedrai parte della risposta:

https://stackoverflow.com/questions/47427/

vs

https://stackoverflow.com/questions/47427/why-do-some-websites-add-slugs-to-the-end-of-urls

Senza markup, il secondo è auto-descrittivo.

Non dimenticare la leggibilità quando si invia un collegamento, non solo nei motori di ricerca. Se invii un’email a qualcuno sul primo link, potranno consultare l’URL e avere un’idea generale di cosa si tratta. Il secondo non dà alcuna indicazione sul contenuto di quella pagina prima che facciano clic.

Se inviasti qualcuno a un link non sarebbe più sensato includere una descrizione scrivendo effettivamente una descrizione piuttosto che far analizzare l’altra persona all’URL in cui esiste la descrizione e provare a leggere un mazzo di -hyphenated parole-stuck-insieme.

Prima di tutto, è SEO e facile da usare, ma nel caso dell’esempio (questo sito), non è fatto bene o correttamente (in quanto è aperto a trucchi cappello nero e avvelenamento da parte di altri, che si rifletterebbe male su questo sito) .

Se

https://stackoverflow.com/questions/47427/why-do-some-websites-add-slugs-to-the-end-of-urls

ha il contenuto, quindi

https://stackoverflow.com/questions/47427/

e

https://stackoverflow.com/questions/47427/any-other-bollix

non dovrebbe essere duplicato Dovrebbero in realtà rilevare automaticamente che il collegamento seguito non sta usando il testo corrente (poiché ovviamente lo slug è definito dal titolo della domanda e può essere modificato successivamente) e dovrebbero redirect automaticamente 301

https://stackoverflow.com/questions/47427/why-do-some-websites-add-slugs-to-the-end-of-urls

assicurando così la regola “un pezzo di contenuto a un URI” e se l’URI si muove / cambia, assicurarsi che i vecchi segnalibri seguano / spostino con esso i reindirizzamenti 301 (in modo che i browser intelligenti possano aggiornare i segnalibri).

Idealmente, lo “slug” dovrebbe essere l’unico identificatore necessario. In pratica, su siti dinamici come questo, devi avere un identificatore numerico univoco o iniziare ad aggiungere / incrementare numeri allo “slug” come fa Digg .