Quali sono i caratteri Unicode non BMP più comuni nell’uso effettivo?

Nella tua esperienza quali caratteri Unicode, codepoint, spazia fuori dal BMP (Basic Plilingual Plane) sono i più comuni finora? Questi sono quelli che richiedono 4 byte in UTF-8 o surrogati in UTF-16.

Mi sarei aspettato che la risposta fosse caratteri cinesi e giapponesi usati nei nomi ma non inclusi nei set di caratteri multibyte CJK più diffusi, ma sul progetto su cui lavoro maggiormente, il Wikizionario inglese, abbiamo scoperto che l’ alfabeto gotico è molto più comune finora.

AGGIORNARE

Ho scritto un paio di strumenti software per scansionare intere Wikipedie per personaggi non BMP e ho scoperto con mia sorpresa che persino l’alfabeto gotico giapponese di Wikipedia è il più comune. Questo è vero anche nella Wikipedia cinese, ma ha anche usato molti caratteri cinesi fino a 50 o 70 volte, inclusi “𨭎”, “𠬠” e “𩷶”.