Articles of unicode

Come posso ottenere il codice Unicode (s) di un personaggio?

Come posso estrarre i punti di codice Unicode di un determinato Character senza prima convertirlo in una String ? So che posso usare quanto segue: let ch: Character = “A” let s = String(ch).unicodeScalars s[s.startIndex].value // returns 65 ma sembra che ci dovrebbe essere un modo più diretto per ottenere ciò usando la libreria standard […]

Un modo semplice per rimuovere gli accenti da una stringa Unicode?

Voglio cambiare questa frase: Et ça sera sa moitié. A : Et ca sera sa moitie. C’è un modo semplice per farlo in Java, come farei in Objective-C? NSString *str = @”Et ça sera sa moitié.”; NSData *data = [str dataUsingEncoding:NSASCIIStringEncoding allowLossyConversion:YES]; NSString *newStr = [[NSString alloc] initWithData:data encoding:NSASCIIStringEncoding];

Rimuovi i caratteri unicode dai file di testo: sed, altri metodi bash / shell

Come rimuovo i caratteri unicode da un gruppo di file di testo sul terminale? Ho provato questo ma non ha funzionato: sed ‘g/\u’U+200E’//’ -i *.txt Devo rimuovere questi unicodes dai file di testo U+0091 – sort of weird “control” space U+0092 – same sort of weird “control” space A0 – non-space break U+200E – left […]

Come sostituire i caratteri latini accentati in Ruby?

Ho un modello ActiveRecord , Foo , che ha un campo name . Mi piacerebbe che gli utenti fossero in grado di cercare per nome, ma mi piacerebbe che la ricerca ignorasse il caso e qualsiasi accento. Pertanto, sto anche memorizzando un campo canonical_name su cui cercare: class Foo validates_presence_of :name before_validate :set_canonical_name private def […]

Elaborazione Unicode in C ++

Qual è la migliore pratica dell’elaborazione Unicode in C ++?

Libreria Unicode Light C

Sto cercando una piccola libreria C per gestire le stringhe utf8. Nello specifico, suddivisione basata su delimitatori unicode da utilizzare con algoritmi di derivazione. I post correlati hanno suggerito: ICU http://www.icu-project.org/ (l’ho trovato troppo voluminoso per i miei scopi su dispositivi embedded) UTF8-CPP: http://utfcpp.sourceforge.net/ (Eccellente, ma C ++ non C) Qualcuno ha trovato librerie codebase […]

Sfida di codifica delle immagini su Twitter

Se un’immagine vale 1000 parole, quanta parte di un’immagine può contenere 140 caratteri? Nota : è gente! La scadenza del Bounty è qui e, dopo una dura riflessione, ho deciso che l’ingresso di Boojum ha appena sfiorato Sam Hocevar . Pubblicherò note più dettagliate una volta che avrò avuto la possibilità di scriverle. Naturalmente, tutti […]

Come abbinare i caratteri cirillici con un’espressione regolare

Come faccio a far corrispondere i caratteri dell’alfabeto cirillico francese e russo con un’espressione regolare? Voglio solo fare i caratteri alfa, nessun numero o caratteri speciali. Proprio ora che ho [A-Za-z]

MySQL VARCHAR Lengths e UTF-8

In MySQL, se creo un nuovo campo VARCHAR(32) in una tabella UTF-8 significa che posso memorizzare 32 byte di dati in quel campo o 32 caratteri (multi-byte)?

Java equivalente a encodeURIComponent di JavaScript che produce un output identico?

Ho sperimentato varie parti del codice Java cercando di creare qualcosa che codifichi una stringa contenente citazioni, spazi e caratteri “esotici” Unicode e produca un output identico alla funzione encodeURIComponent di JavaScript. La mia stringa di test di tortura è: “A” B ± “ Se inserisco la seguente istruzione JavaScript in Firebug: encodeURIComponent(‘”A” B ± […]