Articles of encoding

“Unmappable character for encoding” warning in Java

Attualmente sto lavorando su un progetto Java che sta emettendo il seguente avviso quando compilo: /src/com/myco/apps/AppDBCore.java:439: warning: unmappable character for encoding UTF8 [javac] String copyright = ” 2003-2008 My Company. All rights reserved.”; Non sono sicuro di come SO renderà il personaggio prima della data, ma dovrebbe essere un simbolo di copyright e verrà visualizzato […]

Il modo migliore per codificare i dati di testo per XML

Stavo cercando un metodo generico in .Net per codificare una stringa da usare in un elemento o attributo Xml, e sono rimasto sorpreso quando non ne ho trovato immediatamente uno. Quindi, prima di andare troppo oltre, potrei semplicemente mancare la funzione integrata? Supponendo per un momento che in realtà non esista, sto mettendo insieme il […]

C # ha un equivalente a encodeURIComponent () di JavaScript?

In JavaScript: encodeURIComponent(“©√”) == “%C2%A9%E2%88%9A” Esiste un equivalente per le applicazioni C #? Per sfuggire ai caratteri HTML ho usato: txtOut.Text = Regex.Replace(txtIn.Text, @”[\u0080-\uFFFF]”, m => @”&#” + ((int)m.Value[0]).ToString() + “;”); Ma non sono sicuro di come convertire la corrispondenza nel formato esadecimale corretto utilizzato da JS. Ad esempio questo codice: txtOut.Text = Regex.Replace(txtIn.Text, @”[\u0080-\uFFFF]”, […]

Come ottenere il valore ASCII della stringa in C #

Voglio ottenere il valore ASCII dei caratteri in una stringa in C #. Se la mia stringa ha il valore “9quali52ty3”, voglio un array con i valori ASCII di ciascuno degli 11 caratteri. Come posso ottenere valori ASCII in C #?

Stringa byte Contrassegno da stringa in C #

Ho letto post simili su questo e non rispondono alla mia domanda. In C #, ho una stringa che sto ottenendo da WebClient.DownloadString. Ho provato a impostare client.Encoding su new UTF8Encoding (false), ma ciò non ha fatto alcuna differenza: ho ancora un byte order mark per UTF-8 all’inizio della stringa del risultato. Devo rimuovere questo […]

Binario di testo in Java

Ho una stringa con dati binari al suo interno (1110100) Voglio estrarre il testo in modo da poterlo stampare (1110100 stamperebbe “t”). Ho provato questo, è simile a quello che ho usato per trasformare il mio testo in binario ma non funziona affatto: public static String toText(String info)throws UnsupportedEncodingException{ byte[] encoded = info.getBytes(); String text […]

ruby 1.9: sequenza byte non valida in UTF-8

Sto scrivendo un crawler in Ruby (1.9) che consuma molto HTML da un sacco di siti casuali. Quando ho provato ad estrarre i link, ho deciso di usare semplicemente .scan(/href=”(.*?)”/i) invece di nokogiri / hpricot (maggiore velocità). Il problema è che ora ricevo molti errori di ” invalid byte sequence in UTF-8 “. Da quello […]

Qual è la rappresentazione interna di Java per String? Modificato UTF-8? UTF-16?

Ho cercato la rappresentazione interna di Java per String, ma ho due materiali che sembrano affidabili ma incoerenti. Uno è: http://www.codeguru.com/cpp/misc/misc/multi-lingualsupport/article.php/c10451 e dice: Java utilizza UTF-16 per la rappresentazione del testo interno e supporta una modifica non standard di UTF-8 per la serializzazione delle stringhe. L’altro è: http://en.wikipedia.org/wiki/UTF-8#Modified_UTF-8 e dice: Tcl utilizza anche lo stesso […]

URL e più segni

Sono consapevole che un + nella stringa di query di un URL rappresenta uno spazio. Questo è anche il caso al di fuori della regione stringa di query? Vale a dire, fa il seguente URL: http://a.com/a+b/c in realtà rappresentano: http://a.com/ab/c (e quindi deve essere codificato se dovrebbe effettivamente essere un + ), o in effetti […]

L’uso di atob di Javascript per decodificare base64 non decodifica in modo appropriato le stringhe utf-8

Sto usando la funzione Javascript window.atob() per decodificare una stringa codificata in base64 (in particolare il contenuto codificato in base64 dall’API GitHub). Il problema è che sto ricevendo caratteri con codifica ASCII (come ⢠invece di ™ ). Come posso gestire correttamente il stream in ingresso con codifica Base64 in modo che sia decodificato come […]