Articles of unicode

😃 (e altri caratteri Unicode) in identificatori non consentiti da g ++

Sono 😞 a scoprire che non posso usare 😃 come un identificatore valido con g ++ 4.7, anche con l’opzione -fextended-identifiers abilitata: int main(int argc, const char* argv[]) { const char* 😃 = “I’m very happy”; return 0; } main.cpp: 3: 3: errore: stray ‘\ 360’ nel programma main.cpp: 3: 3: errore: stray ‘\ 237’ […]

Perché non posso usare \ u000D e \ u000A come CR e LF in Java?

Perché non posso usare \ u000D e \ u000A come CR e LF in Java? Sta dando un errore quando compilo il codice: illegal line end in character literal

Codifica utf-8 FPDF (HOW-TO)

Qualcuno sa come impostare la codifica nel pacchetto FPDF su utf-8? O almeno per ISO-8859-7 (greco) che supporta i caratteri greci? Fondamentalmente voglio creare un file pdf contenente caratteri greci. Qualsiasi suggerimento sarebbe d’aiuto. Giorgio

Codifica caratteri JSON – UTF-8 è ben supportato dai browser o dovrei usare sequenze numeriche di escape?

Sto scrivendo un webservice che usa JSON per rappresentare le sue risorse, e sono un po ‘bloccato pensando al modo migliore per codificare il json. Leggendo json rfc ( http://www.ietf.org/rfc/rfc4627.txt ) è chiaro che la codifica preferita è utf-8. Ma rfc descrive anche un meccanismo di escape delle stringhe per specificare i caratteri. Presumo che […]

Riduzione programmatica dell’accentuazione di JavaScript (ovvero normalizzazione o inaccessibilità del testo)

Ho bisogno di confrontare 2 stringhe uguali come queste: Lubecca == Lubecca In JavaScript. Perché? Bene, ho un campo di auto-completamento che sta andando a un servizio Java usando Lucene, dove i nomi dei luoghi sono memorizzati naturalmente (come Lübeck), ma anche indicizzati come testo normalizzato, import sun.text.Normalizer; oDoc.setNameLC = Normalizer.normalize(oLocName, Normalizer.DECOMP, 0) .toLowerCase().replaceAll(“[^\\p{ASCII}]”,””); In […]

JSON e personaggi in fuga

Ho una stringa che viene serializzata su JSON in Javascript e quindi deserializzata in Java. Sembra che la stringa contenga un simbolo di grado, quindi ho un problema. Potrei usare un aiuto per capire a chi dare la colpa: è l’implementazione di Spidermonkey 1.8? (questo ha un built-in JSON integrato) è Google Gson ? sono […]

(grep) Regex per abbinare caratteri non ASCII?

Su Linux, ho una directory con molti file. Alcuni di loro hanno caratteri non ASCII, ma sono tutti UTF-8 validi. Un programma ha un bug che impedisce di lavorare con nomi di file non ASCII, e devo scoprire quanti ne sono interessati. Stavo per farlo con find e poi fare un grep per stampare i […]

python3 stampa unicode alla codifica console windows xp cp437

Ok, voglio stampare una stringa nella mia console windows xp. Ci sono diversi caratteri che la console non può stampare, quindi devo codificare il mio stdout.encoding che è ‘cp437’. ma stampando la stringa codificata, il ‘ß’ viene stampato come ‘\ xe1’. dopo aver decodificato di nuovo in unicode e aver stampato la stringa, ottengo l’output […]

Stampa di caratteri Unicode al prompt di PowerShell

Sto cercando di configurare Mercurial per stampare lo stato del repository attualmente in uso con PowerShell. Finora, ho tutto funzionante, ma mi piacerebbe poter stampare ‘☿’ al prompt quando sono in un repository. Sfortunatamente, sembra che PowerShell abbia qualche problema con la stampa di caratteri Unicode. Nella risposta accettata per Esiste una shell dei comandi […]

Visualizzazione di caratteri arabi nell’applicazione console C #

Credo che sia stato ansible mostrare caratteri arabi su un’applicazione console 13+ anni fa, dai tempi di Windows ME. Ora sto usando Visual Studio 2013, su un Windows 8, e il codice seguente mostra: ????? ?? Console.OutputEncoding = System.Text.Encoding.Unicode; Console.WriteLine(“مرحبا بك”); Esiste comunque la possibilità di mostrare i caratteri arabi nell’output della console?