E encontrei mais uma fonte para reforçar a ideia https://en.wikipedia.org/wiki/UTF-8#cite_note-17 . Aí explica que por "convencão" um RFC limitou essa extensão. Mas tecnicamente falando ele pode se extender até onde se quiser, se posso assim dizer