Articles of unicode

Come posso distriggersre Unicode in un progetto VC ++?

Ho un progetto VC ++ in Visual Studio 2008. Sta definendo i simboli per unicode sulla riga di comando del compilatore ( /D “_UNICODE” /D “UNICODE” ), anche se non ho questo simbolo triggersto nella sezione del preprocessore per il progetto. testo alternativo http://sofit.miximages.com/visual-studio/14nz693.png Di conseguenza sto compilando le versioni Unicode di tutte le funzioni […]

Decodifica UTF-8 con Javascript

Ho Javascript in una pagina Web XHTML che sta passando le stringhe con codifica UTF-8. Deve continuare a passare la versione UTF-8 e decodificarla. Come è ansible decodificare una stringa UTF-8 per la visualizzazione? // <![CDATA[ function updateUser(usernameSent){ var usernameReceived = usernameSent; // Current value: Größe var usernameDecoded = usernameReceived; // Decode to: Größe var […]

Corrispondenti caratteri accentati con espressioni regex JavaScript

Ecco uno snippet divertente in cui mi sono imbattuto oggi: /\ba/.test(“a”) –> true /\bà/.test(“à”) –> false Però, /à/.test(“à”) –> true Innanzitutto, wtf? In secondo luogo, se voglio abbinare un carattere accentato all’inizio di una parola, come posso farlo? (Mi piacerebbe davvero evitare l’uso di selettori over-the-top come /(?:^|\s|’|\(\) …. )

Cosa fornisce “ e dove è documentato?

Il nuovo standard C ++ 11 menziona un’intestazione , presumibilmente in analogia con di C99. Ora sappiamo che C ++ 11 porta nuovi tipi di caratteri e letterali che sono specificatamente progettati per UTF16 e UTF32, ma non pensavo che il linguaggio avrebbe effettivamente contenuto funzioni per convertire la codifica multibyte stretta (dipendente dal sistema) […]

Passando l’argomento unicode della riga di comando al codice Java

Devo passare l’argomento della riga di comando che è il metodo principale da giapponese a Java. Se digito caratteri Unicode sulla finestra della riga di comando, viene visualizzato ‘?????’ che è OK, ma il valore passato al programma java è anche ‘?????’. Come ottengo il valore corretto dell’argomento passato dalla finestra di comando? Di seguito […]

Come compilare un file sorgente Java che è codificato come “UTF-8”?

Ho salvato il mio file sorgente Java specificando il suo tipo di codifica come UTF-8 (utilizzando Blocco note, per impostazione predefinita il tipo di codifica del Blocco note è ANSI) e quindi ho provato a compilarlo utilizzando: javac -encoding “UTF-8″ One.java ma ha dato un messaggio di errore ” One.java:1: illegal character: \65279 ?public class […]

Scrivere utf16 su file in modalità binaria

Sto cercando di scrivere un wstring per archiviare con ofstream in modalità binaria, ma penso che stia facendo qualcosa di sbagliato. Questo è quello che ho provato: ofstream outFile(“test.txt”, std::ios::out | std::ios::binary); wstring hello = L”hello”; outFile.write((char *) hello.c_str(), hello.length() * sizeof(wchar_t)); outFile.close(); Aprendo test.txt in ad esempio Firefox con codifica impostata su UTF16 verrà […]

I caratteri nella stringa sono cambiati dopo aver scaricato HTML da Internet

Utilizzando il seguente codice, posso scaricare l’HTML di un file da internet: WebClient wc = new WebClient(); // …. string downloadedFile = wc.DownloadString(“http://www.myurl.com/”); Tuttavia, a volte il file contiene caratteri “interessanti” come é to é , da ← a ↠e da フシギダネ a フシギダム. Penso che possa essere qualcosa a che fare con […]

😃 (e altri caratteri Unicode) in identificatori non consentiti da g ++

Sono 😞 a scoprire che non posso usare 😃 come un identificatore valido con g ++ 4.7, anche con l’opzione -fextended-identifiers abilitata: int main(int argc, const char* argv[]) { const char* 😃 = “I’m very happy”; return 0; } main.cpp: 3: 3: errore: stray ‘\ 360’ nel programma main.cpp: 3: 3: errore: stray ‘\ 237’ […]

Perché non posso usare \ u000D e \ u000A come CR e LF in Java?

Perché non posso usare \ u000D e \ u000A come CR e LF in Java? Sta dando un errore quando compilo il codice: illegal line end in character literal