Articles of unicode

Comment normaliser une chaîne en utilisant ICU4C?

Je trouve la documentation ICU quelque peu difficile. Ma question est la suivante: comment normaliser une chaîne en utilisant ICU4C? Je regarde unorm2_normalize, mais que se passe-t-il si le tampon n’est pas assez grand? Comment pourrais-je savoir cela avant? Naturellement, je veux normaliser la chaîne entière. Merci! :> PS Voici la documentation API sur cette […]

Texte UTF-8 dans le presse-papier C

Je cherchais comment amener une ficelle, const char* output = “ヽ(⌐■_■)ノ♪♬”; dans le presse-papier. SetClipboardData(CF_UNICODETEXT, hMem); J’ai essayé MultiByteToWideChar, mais je n’ai eu que du bruit et des déclarations contradictoires disant qu’il est impossible d’enregistrer UTF-16LE dans le presse-papier (wchar_t). Honnêtement je suis juste confus. Une direction ou un exemple de code serait génial.

Obtenir un programme construit Dev-C ++ pour générer des caractères UNICODE sur la ligne de commande Windows

Si vous pouviez répondre à mes questions, ce serait génial. Voici le scoop: j’enseigne une introduction à la classe de programmation en Thaïlande pour les 11e année. Cela va très bien jusqu’à présent, leur niveau d’anglais est suffisamment élevé pour que je puisse enseigner en anglais et leur demander d’écrire des programmes en anglais, et […]

Problème d’affichage de la largeur en caractères UTF-8 pour les caractères chinois

Quand j’utilise Perl ou C pour printf des données, j’ai essayé leur format pour contrôler la largeur de chaque colonne, comme printf(“%-30s”, str); Mais lorsque str contient un caractère chinois, la colonne ne s’aligne pas comme prévu. voir la photo jointe. Le codage de mon jeu de caractères ubuntu est zh_CN.utf8, autant que je sache, […]

Terminateur de chaîne UTF-16

Quelle est la séquence de terminaison de chaîne pour une chaîne UTF-16? MODIFIER: Permettez-moi de reformuler la question pour tenter de clarifier. Comment fonctionne l’appel à wcslen() ?

Conversion UTF-8 en caractères larges

#ifndef UNICODE #define UNICODE #endif #include #include #include using namespace std; int main() { FILE* resFile; char multiByteStr[256]; ifstream oFile; FILE* exampleFile; TCHAR buffer[256]; system(“chcp 65001″); resFile = _wfopen(L”foo”,L”w, ccs=UTF-8″); fwprintf(resFile,L”%s”,L”C:\\exsistingFolder\\zażółć gęśłą jaźń ☺☻♥♦• ć.txt”); fclose(resFile); oFile.open(L”foo”); oFile.getline(multiByteStr,256,’\n’); oFile.close(); MultiByteToWideChar(CP_UTF8,0,multiByteStr,256,buffer,256); wprintf(L”%s”,buffer); exampleFile = _wfopen(buffer,L”w, ccs=UTF-16LE”); fwprintf(exampleFile,L”%s”,buffer); fclose(exampleFile); system(“pause”); return 0; } Comme vous pouvez le […]

Comment utiliser les types stdint avec _tprintf dans Visual Studio 2013?

Prenons l’exemple suivant: char* fileName = “C:\\windows\\system32\\kernel32.dll”; uint32_t fileSize = 1163264; printf(“The size of %s is %”PRIu32″\n”, fileName, fileSize); Tout va bien, maintenant si nous voulons un support unicode transparent via tchar.h le code ressemblerait à ceci: TCHAR* fileName = _T(“C:\\windows\\system32\\kernel32.dll”); uint32_t fileSize = 1163264; _tprintf(_T(“The size of %s is %”)_T(PRIu32)_T(“\n”), fileName, fileSize); Cela fonctionne […]

dois-je éliminer TCHAR du code Windows?

Je révise un très vieux code C (10 ans). Le code est compilé sous Unix / Mac avec GCC et compilé pour Windows avec MinGW. Actuellement, il y a des chaînes TCHAR. J’aimerais supprimer le TCHAR et utiliser plutôt une chaîne C ++. Est-il toujours nécessaire d’utiliser les fonctions Windows, ou puis-je tout faire maintenant […]

Quelle est la différence entre glib gunichar et wchar_t et quelle est la meilleure solution pour les solutions multiplateformes?

J’essaie d’écrire du code C qui n’est portable que dans la mesure où l’utilisateur dispose de gcc et de l’installation de glib . De toutes mes recherches, j’ai trouvé qu’avec gcc , un wchar_t est toujours défini comme 4 octets, et avec gunichar un gunichar est également de 4 octets. Ce que je n’ai pas […]

Existe-t-il une constante Python pour les espaces Unicode?

Le module de ssortingng contient un atsortingbut d’ whitespace , qui est une chaîne composée de tous les caractères ASCII considérés comme des espaces. Existe-t-il une constante correspondante qui inclut également des espaces Unicode, tels que l’ espace de rupture (U + 00A0) ? Nous pouvons voir dans la question ” ssortingp () et ssortingp […]