Provo ad abbozzare una risposta, ma tieni conto che non sono un esperto della materia e (quindi) non dispongo nemmeno d’informazioni particolarmente aggiornate.
Innanzitutto, ricordiamo che «[
s]ulla natura di questo elemento verbale [dei composti verbo-sostantivo, cioè] non c’è accordo tra gli studiosi, che pensano a un imperativo, a un indicativo o, come forse è preferibile, al puro tema verbale» (Serianni,
Grammatica italiana XV.123).
L’imperativo è senz’altro l’ipotesi piú soddisfacente dal punto di vista
morfologico: si pensi a basi quali
lava- (<
lavare, 1ª coniug., imp.
lava),
reggi- (<
reggere, 2ª, imp.
reggi),
copri- (
coprire, 3ª, imp.
copri).
Dal punto di vista
sintattico-semantico, l’indicativo è forse, invece, la scelta piú logica (almeno alla 3ª persona): si pensi a
falegname, «[colui che]
fa legname», o a
lavapiatti, «[colui/colei/ciò che]
lava i piatti», etc. Tuttavia, essa risulta piuttosto schizofrenica (e quindi difficile da giustificare) sul piano morfologico, facendo pensare a una 3ª persona per la prima coniugazione (
lava) e a una 2ª per le altre due (
reggi,
copri).
Il puro tema verbale, poi, se è forse la scelta che piú appaga i grammatici [di oggi] per il suo carattere di assoluta generalità, pone dei problemi per la 2ª coniugazione, la cui vocale tematica è
e, non
i (
e.g.,
regge-, non
reggi-). Inoltre, se è vero che, quando un modulo diventa produttivo, non ci s’interroga piú sulla sua origine e si applica in modo automatico, c’è da chiedersi come, almeno inizialmente, i parlanti (non i grammatici, cioè) siano arrivati [morfologicamente] all’idea del «puro tema verbale».
Detto questo, però, non mi stupirei piú di tanto per le «eccezioni» da te riportate.
Prendiamo il caso di
falegname: il
TLIO ce ne dà un’[unica] attestazione, romana, risalente al XIV secolo. Ora, ricordiamoci che il romano, prima di essere fiorentinizzato dai papi medici, era un dialetto [alto]meridionale e, comunque, piú affine agli altri dialetti centrali non toscani che al fiorentino.
Se, quindi, supponiamo che la cogeminazione del romano trecentesco fosse piú vicina al tipo laziale (non romano) odierno (o, comunque, centrale non toscano, o anche [alto]meridionale) che non a quello del romano dei nostri giorni, si dovrà ammettere che la 2ª persona degl’imperativi [monosillabici] potesse essere cogeminante (come oggi, anche in toscano non fiorentino, e, fino all’Ottocento, nello stesso fiorentino), ma la 3ª persona dei rispettivi indicativi, per esempio, no.
Inoltre, se è vero che nell’italiano antico la grafia teneva piú conto che oggi del raddoppiamento sintattico, è anche vero che essa era molto piú «anarchica», e da essa non ci può aspettare la stessa coerenza e uniformità attuali.
Concludendo, ogniqualvolta un composto sia di provenienza non toscana (e/o sia stato trasmesso per via essenzialmente scritta e, qualunque ne sia la ragione, l’eventuale raddoppiamento non sia stato segnato), se la composizione non è piú che perspicua, esso verrà probabilmente adottato nella forma in cui è stato tramandato,
no questions asked.