Come rimuovere registrati, marchi e simboli di copyright da una stringa?

voti
0

Ho un dataframe con i nomi degli oggetti. Alcuni degli oggetti sono simboli speciali come ® e ™

Esempio:
ProStand® Front Air Suspension
Onco connettore ™

Ho cercato db[grep(®,db$objectName), ]di trovare i simboli speciali, ma R non è in ripresa in su, anche se li vedo in dataframe.

Questo non ha funzionato neanche
db$objectName[db$objectName == ProStand® Front Air Suspension ]<- ProStand Front Air Suspension

Come faccio a trovare i caratteri speciali e rimuoverli dalle corde del mio dataframe?

È pubblicato 10/10/2019 alle 01:02
fonte dall'utente
In altre lingue...                            


2 risposte

voti
1

Se siete alla ricerca di qualcosa di un po 'più generico, utilizzando stringr, si potrebbe provare con, ad esempio:

str_remove(string = "ProStand® Front Air Suspension", pattern = "[^[:alnum:][:space:]]+")

che dà

"ProStand Front Air Suspension"

Ciò elimina praticamente tutto ciò che non è un numero, non una lettera, e non uno spazio.

Risposto il 10/10/2019 a 01:10
fonte dall'utente

voti
0

Ecco uno facendo corrispondere i caratteri Unicode e sostituirlo con vuoto

library(stringr)
str_replace_all(str1, "\\u00AE|\\u00a9|\\u2122", "")
#[1] "ProStand Front Air Suspension"

dati

str1 <- "ProStand® Front Air© Suspension™"
Risposto il 10/10/2019 a 01:17
fonte dall'utente

Cookies help us deliver our services. By using our services, you agree to our use of cookies. Learn more