Articles of unicode

Javascript: stringa Unicode in esadecimale

Sto provando a convertire una stringa unicode in una rappresentazione esadecimale in javascript. Questo è quello che ho: function convertFromHex(hex) { var hex = hex.toString();//force conversion var str = ”; for (var i = 0; i < hex.length; i += 2) str += String.fromCharCode(parseInt(hex.substr(i, 2), 16)); return str; } function convertToHex(str) { var hex = […]

Ruby 1.9: come posso aggiornare e downcase correttamente le stringhe multibyte?

Quindi matz ha preso la decisione di mantenere il upcase e il downcase limitati a /[AZ]/i in ruby ​​1.9.1. ActiveSupport::Multibyte ha avuto a lungo un ottimo jiggering di case i18n in ruby ​​1.8.x tramite String#mb_chars . Tuttavia, se provato con il ruby 1.9.1, non sembra funzionare. Ecco un semplice script di test che ho scritto, […]

Quali sono i caratteri Unicode non BMP più comuni nell’uso effettivo?

Nella tua esperienza quali caratteri Unicode, codepoint, spazia fuori dal BMP (Basic Plilingual Plane) sono i più comuni finora? Questi sono quelli che richiedono 4 byte in UTF-8 o surrogati in UTF-16. Mi sarei aspettato che la risposta fosse caratteri cinesi e giapponesi usati nei nomi ma non inclusi nei set di caratteri multibyte CJK […]

Come confrontare i caratteri Unicode che si “assomigliano”?

Cado in un problema sorprendente. Ho caricato un file di testo nella mia applicazione e ho una logica che confronta il valore con μ. E ho capito che anche se i testi sono uguali, il valore di confronto è falso. Console.WriteLine(“μ”.Equals(“µ”)); // returns false Console.WriteLine(“µ”.Equals(“µ”)); // return true Nella riga successiva il carattere μ viene […]

Dati di test di esempio UTF-8 veramente buoni, cattivi

Quindi abbiamo il cheat XSS per testare il nostro filtro XSS – ma a parte un esempio di pagina benigna non riesco a trovare dati di test maligni o malformati per assicurarmi che il mio codice UTF-8 sia in grado di gestire i dati di missbehaving. Dove posso trovare dei buoni e cattivi dati da […]

Come dovrei preparare i miei programmi Delphi a 32 bit per un eventuale compilatore a 64 bit?

Possibile duplicato: Come preparare anche i 64 bit durante la migrazione a Delphi 2010 e Unicode Dato che credo che il compilatore Delphi a 64 bit apparirà presto, sono curioso di sapere qual è il tipo di programmi che ora sono a 32 bit e che compilano e funzionano senza modifiche quando si utilizza il […]

Converti tra string, u16string e u32string

Stavo cercando un modo per convertire tra i tipi di stringa Unicode e ho trovato questo metodo . Non solo non capisco completamente il metodo (non ci sono commenti) ma anche l’articolo implica che in futuro ci saranno metodi migliori. Se questo è il metodo migliore, potresti per favore indicare cosa lo fa funzionare, e […]

Abbina qualsiasi carattere non verbale (esclusi segni diacritici)

Supponendo che tu abbia il seguente testo: Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam Lorem! nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum […]

Perché è ansible eseguire codice Java nei commenti con determinati caratteri Unicode?

Il seguente codice produce l’output “Hello World!” (no davvero, provalo). public static void main(String… args) { // The comment below is not a typo. // \u000d System.out.println(“Hello World!”); } La ragione di ciò è che il compilatore Java analizza il carattere Unicode \u000d come una nuova riga e viene trasformato in: public static void main(String… […]

Qual è l’opzione migliore per visualizzare testo Unicode (ebraico, ecc.) In VB6

Ho alcuni clienti che vogliono usare il nostro software di logopedia in ebraico. I programmi sono in VB6. L’opzione migliore di cui sono a conoscenza sono: utilizzare i controlli di Forms 2.0 da MS Office, ma non è ansible distribuirli. http://www.hexagora.com/en_dw_unictrl.asp $ 899 http://www.iconico.com/UniToolbox/ $ 499 Altre opzioni?