Articles of utf 8

Non è sulle macchine big endian l’ordine dei byte dell’UTF-8 diverso da quello delle macchine little endian? Quindi, perché allora UTF-8 non richiede una distinta base?

UTF-8 può contenere una BOM. Tuttavia, non fa alcuna differenza per quanto riguarda l’endianness del stream di byte. UTF-8 ha sempre lo stesso ordine di byte. Se Utf-8 memorizza tutti i punti di codice in un singolo byte, allora avrebbe senso perché endianness non ha alcun ruolo e quindi perché BOM non è richiesto. Ma […]

Qual è il modo migliore per esportare i dati UTF8 in Excel?

Quindi abbiamo questa web app in cui supportiamo i dati UTF8. Hooray UTF8. E possiamo esportare i dati forniti dall’utente in CSV senza problemi – è ancora in UTF8 a quel punto. Il problema è quando apri un tipico file UTF8 CSV in Excel, lo legge come testo codificato ANSII e di conseguenza prova a […]

Stampa correttamente i caratteri utf8 nella console di Windows

Questo è il modo in cui provo a farlo: #include #include using namespace std; int main() { SetConsoleOutputCP(CP_UTF8); //german chars won’t appear char const* text = “aäbcdefghijklmnoöpqrsßtuüvwxyz”; int len = MultiByteToWideChar(CP_UTF8, 0, text, -1, 0, 0); wchar_t *unicode_text = new wchar_t[len]; MultiByteToWideChar(CP_UTF8, 0, text, -1, unicode_text, len); wprintf(L”%s”, unicode_text); } E l’effetto è che vengono […]

Come convertire (traslitterato) una stringa da utf8 a ASCII (singolo byte) in c #?

Ho un object stringa “con più personaggi e persino caratteri speciali” Sto cercando di usare UTF8Encoding utf8 = new UTF8Encoding(); ASCIIEncoding ascii = new ASCIIEncoding(); oggetti per convertire quella stringa in ascii. Posso chiedere a qualcuno di portare un po ‘di luce a questo semplice compito, che è la caccia al mio pomeriggio. MODIFICA 1: […]

Leggi un file di testo UTF-8 con BOM

Ho un file di testo con il segno di ordinazione Byte (U + FEFF) all’inizio. Sto cercando di leggere il file in R. È ansible evitare il segno dell’ordine Byte? La funzione fread (dal pacchetto data.table ) legge il file, ma aggiunge ļ»æ all’inizio del nome della prima variabile: > names(frame_pers)[1] [1] “ļ»æreg_date” Lo stesso […]

Controlla se una stringa è valida con codifica UTF-8 in Java

Come posso verificare se una stringa è in formato UTF-8 valido?

MySQL genera errori di stringa errati

Sto cercando di memorizzare il seguente tweet in una colonna lunga / utf8 charset / MySQL 5.5. database con archivio MyISAM attivo. Abbiamo anche provato i set di caratteri utf8mb4, utf16, utf32 ma non siamo riusciti a superare questo problema. tweet=”@Dorable_Dimples: Okay enough of those #IfYouWereMines I’m getting dep ressed. #foreveralone ?” lol yes mysql> […]

Produzione di XML validi con codifica Java e UTF-8

Sto usando JAXP per generare e analizzare un documento XML dal quale alcuni campi vengono caricati da un database. Codice per serializzare l’XML: DocumentBuilder builder = DocumentBuilderFactory.newInstance().newDocumentBuilder(); Document doc = builder.newDocument(); Element root = doc.createElement(“test”); root.setAttribute(“version”, text); doc.appendChild(root); DOMSource domSource = new DOMSource(doc); TransformsrFactory tFactory = TransformsrFactory.newInstance(); FileWriter out = new FileWriter(“test.xml”); Transformsr transformsr = […]

Come convertire stringa UTF8 in array di byte?

La funzione .charCodeAt ritorna con il codice unicode del carattere. Ma vorrei invece ottenere la matrice di byte. Lo so, se il charcode è superiore a 127, allora il carattere è memorizzato in due o più byte. var arr=[]; for(var i=0; i<str.length; i++) { arr.push(str.charCodeAt(i)) }

Aggiunta di un’interruzione di riga a un UITextView

Ho un UITextView che prende un NSString con formattazione stringWithUTF8String . Sta ottenendo i suoi valori da un database e voglio che il testo nel database sia reso con interruzioni all’interno del testo. Ho provato a usare \n per farlo ma viene visualizzato come testo. Facendo questo nella mia pagina di informazioni della app come […]