<div dir="ltr"><div dir="ltr"><div class="gmail_default" style="font-family:"times new roman",serif;font-size:large"><br></div></div><br><div class="gmail_quote"><div dir="ltr" class="gmail_attr">On Mon, Mar 20, 2023 at 4:48 PM Steffen Nurpmeso <<a href="mailto:steffen@sdaoden.eu">steffen@sdaoden.eu</a>> wrote:<br></div><div dir="ltr" class="gmail_attr"><br></div><blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left:1px solid rgb(204,204,204);padding-left:1ex">However note that even something like "uppercase this string"<br>
cannot be done the right way, because a truly Unicode aware<br>
operation needs to look at the entire string (sentence), because<br>
there may be interdependencies that modify the result.</blockquote><div><br></div><div class="gmail_default" style="font-family:"times new roman",serif;font-size:large">If you are talking about downcasing Greek Σ, then it's true that always downcasing Σ to σ is inadequate.  Unicode specifies that if the Σ appears before a space or punctuation mark, it downcases to ς instead.  But this is not always correct.</div><div class="gmail_default" style="font-family:"times new roman",serif;font-size:large"><br></div><div class="gmail_default" style="font-family:"times new roman",serif;font-size:large">For example, if the string "ΦΙΛΟΣ." is the word "φιλοσ" (meaning 'beloved' or 'friend') at the end of a sentence, "φιλοσ." is the correct downcasing.  But if it is the abbreviation for "φιλοσοφία", meaning "philosophy", then the correct downcasing is "φιλοσ."  So getting this right is an AI-complete problem which neither Unicode nor ICU can solve.</div></div></div>