Replicare i risultati di pd.merge in SQL?

voti
18

Ho giocato con alcuni set di dati localmente in Python, e ora sto cercando di replicare gli stessi risultati in un ambiente cloud con SQL

Ho 3 tabelle, ognuna con più ID duplicati. Per esempio, la tabella A conterrà gli IDa, b, c, d, ..., la tabella B conterrà gli a, c, e, a1, a2 ...ID, e la tabella C conterrà gli ID d, f, a2, b1, b2, ...

Attualmente sto facendo pd.mergeper la tabella A e la tabella B su ID a, e la tabella C con la tabella risultante dalla prima fusione su ID a2. Usando pd.merge, ho notato che avrebbe aggiunto a _xo a _yagli ID duplicati (con questo, intendo nel primo pd.mergedella tabella A e della tabella B, cdalla tabella A sarebbe diventato c_x, e cdalla tabella B sarebbe diventato c_ye così via per qualsiasi altro ID duplicato. Lo stesso varrebbe per qualsiasi altro ID duplicato per qualsiasi unione

Come potrei replicare questo processo e bypassare il problema con ID duplicati in SQL?

È pubblicato 26/05/2020 alle 03:30
fonte dall'utente
In altre lingue...                            


1 risposte

voti
0

Penso che si possa rinominare nell'iscrizione il resto delle colonne unite con nuovi nomi:

SELECT table_A.ID_a, table_A.c_ID as c_ID_from_A, table_B.c_ID as c_ID_from_B
FROM table_A
JOIN table_B ON(table_A.ID_a = table_B.ID_a)

Spero che lo troviate utile.

Risposto il 10/06/2020 a 15:51
fonte dall'utente

Cookies help us deliver our services. By using our services, you agree to our use of cookies. Learn more