Nifty:
“All Of The String Types”, Lemon Donnell (https://lambdalemon.gay/posts/string-types).
Via Lobsters: https://lobste.rs/s/khf0ye/all_string_types
#Programming #PLDI #String #ProgrammingLanguages #Unicode #UTF8 #Characters
Nifty:
“All Of The String Types”, Lemon Donnell (https://lambdalemon.gay/posts/string-types).
Via Lobsters: https://lobste.rs/s/khf0ye/all_string_types
#Programming #PLDI #String #ProgrammingLanguages #Unicode #UTF8 #Characters
Telegraph API: CONTENT_TOO_BIG приходит раньше обещанных 64 КБ. Измеряем реальный лимит и разбираем обходной путь
Telegraph API обещает принимать content до 64 КБ, но на практике CONTENT_TOO_BIG прилетает уже на 17-20 КБ. Разбираю, как измерял реальный лимит, при чём тут UTF-8 vs UTF-16 для кириллицы, и каким обходным путём чинил молчаливую деградацию RU-канала.
https://habr.com/ru/articles/1026610/
#Telegraph_API #CONTENT_TOO_BIG #Nodejs #Telegram #кириллица #UTF8 #дебаг #лимиты_API #fetch #интеграции

В документации Telegraph API для эндпоинта createPage указано ограничение на поле content : content (Array of Node, up to 64 KB). Content of the page. В реальности цифра не соответствует поведению....
Как (не) перевернуть строку, или Ох, уж этот Unicode
Это текстовая версия доклада с Java Rock Star Meetup, с которым выступал Александр Ланцов — ведущий разработчик Мир Plat.Form. Если вы больше любите смотреть видео, то смотрите запись доклада на YouTube или VK Видео . Читать далее 🔍
https://habr.com/ru/companies/nspk/articles/1024668/
#java #unicode #utf8 #utf16 #кодировки #обработка_строк #emoji #суррогатные_пары #графемные_кластеры
Recorded a talk on of my favourite things in the computer world: Character sets and encodings:
https://www.youtube.com/watch?v=svDT3bp3Sas
In it, I talk about the bits and bytes of ASCII and UTF-8, and how to apply all of this on the Unix command line, Java, Go, HTML, HTTP and not to forget, the database.
Is WTF-16 real or are the JS guys hallucinating stuff again?
TIL that #microsoft leaked their historical mistakes into the Language Server Protocol which uses UTF-16 in various places 🤦♂️
#MémoireDesHommes 27 bases de données disponibles en libre téléchargement.
Chaque lien correspond à une base de données. Il permet de télécharger un dossier zippé comprenant un nombre variable de fichiers #CSV. Les bases de données ont été découpées par lettre, mais pas uniquement. Le format d'encodage de caractère est #UTF8.
https://www.memoiredeshommes.defense.gouv.fr/conflits-operations/telechargement-des-bases
#1GM #2GM #Résistance #MPLF #FusillésPourlExemple #Déportés #Alsaciens #Mosellans #VictimesCiviles