SQL Server: imposta tutti i maiuscole / minuscole su Caso corretto / Caso titolo

Ho una tabella che è stata importata come tutte le MAIUSCOLE e vorrei convertirla in caso corretto. Quale script qualcuno di voi ha usato per completare questo?

Ecco una UDF che farà il trucco …

create function ProperCase(@Text as varchar(8000)) returns varchar(8000) as begin declare @Reset bit; declare @Ret varchar(8000); declare @i int; declare @c char(1); if @Text is null return null; select @Reset = 1, @i = 1, @Ret = ''; while (@i <= len(@Text)) select @c = substring(@Text, @i, 1), @Ret = @Ret + case when @Reset = 1 then UPPER(@c) else LOWER(@c) end, @Reset = case when @c like '[a-zA-Z]' then 0 else 1 end, @i = @i + 1 return @Ret end 

Dovrai comunque usarlo per aggiornare i tuoi dati.

Questa funzione:

  • “Casi corretti” tutte le parole “MAIUSCOLO SUPERIORE” che sono delimitate dallo spazio bianco
  • lascia “parole minuscole” da solo
  • funziona correttamente anche per alfabeti non inglesi
  • è portatile in quanto non utilizza funzioni di fantasia delle recenti versioni del server SQL
  • può essere facilmente modificato per utilizzare NCHAR e NVARCHAR per il supporto Unicode, oltre a qualsiasi lunghezza di parametro che si ritenga appropriata
  • la definizione dello spazio bianco può essere configurata
 CREATE FUNCTION ToProperCase(@string VARCHAR(255)) RETURNS VARCHAR(255) AS BEGIN DECLARE @i INT -- index DECLARE @l INT -- input length DECLARE @c NCHAR(1) -- current char DECLARE @f INT -- first letter flag (1/0) DECLARE @o VARCHAR(255) -- output string DECLARE @w VARCHAR(10) -- characters considered as white space SET @w = '[' + CHAR(13) + CHAR(10) + CHAR(9) + CHAR(160) + ' ' + ']' SET @i = 1 SET @l = LEN(@string) SET @f = 1 SET @o = '' WHILE @i <= @l BEGIN SET @c = SUBSTRING(@string, @i, 1) IF @f = 1 BEGIN SET @o = @o + @c SET @f = 0 END ELSE BEGIN SET @o = @o + LOWER(@c) END IF @c LIKE @w SET @f = 1 SET @i = @i + 1 END RETURN @o END 

Risultato:

 dbo.ToProperCase('ALL UPPER CASE and SOME lower ÄÄ ÖÖ ÜÜ ÉÉ ØØ ĈĈ ÆÆ') ----------------------------------------------------------------- All Upper Case and Some lower Ää Öö Üü Éé Øø Cc Ææ 
 UPDATE titles SET title = UPPER(LEFT(title, 1)) + LOWER(RIGHT(title, LEN(title) - 1)) 

http://sqlmag.com/t-sql/how-title-case-column-value

Se è ansible abilitare il CLR in SQL Server (richiede 2005 o versioni successive), è ansible creare una funzione CLR che utilizza la funzione incorporata TextInfo.ToTitleCase che consente di creare un modo di fare cultura in questo modo solo in alcuni linee di codice.

Sono un po ‘in ritardo nel gioco, ma credo che sia più funzionale e funzioni con qualsiasi lingua, tra cui russo, tedesco, tailandese, vietnamita ecc. Renderà maiuscolo dopo’ o – o. o (o) o spazio (ovviamente :).

 CREATE FUNCTION [dbo].[fnToProperCase]( @name nvarchar(500) ) RETURNS nvarchar(500) AS BEGIN declare @pos int = 1 , @pos2 int if (@name <> '')--or @name = lower(@name) collate SQL_Latin1_General_CP1_CS_AS or @name = upper(@name) collate SQL_Latin1_General_CP1_CS_AS) begin set @name = lower(rtrim(@name)) while (1 = 1) begin set @name = stuff(@name, @pos, 1, upper(substring(@name, @pos, 1))) set @pos2 = patindex('%[- ''.)(]%', substring(@name, @pos, 500)) set @pos += @pos2 if (isnull(@pos2, 0) = 0 or @pos > len(@name)) break end end return @name END GO 

So che questo è post in ritardo in questa discussione ma, vale la pena guardare. Questa funzione funziona per me sempre. Quindi ho pensato di condividerlo.

 CREATE FUNCTION [dbo].[fnConvert_TitleCase] (@InputString VARCHAR(4000) ) RETURNS VARCHAR(4000) AS BEGIN DECLARE @Index INT DECLARE @Char CHAR(1) DECLARE @OutputString VARCHAR(255) SET @OutputString = LOWER(@InputString) SET @Index = 2 SET @OutputString = STUFF(@OutputString, 1, 1,UPPER(SUBSTRING(@InputString,1,1))) WHILE @Index <= LEN(@InputString) BEGIN SET @Char = SUBSTRING(@InputString, @Index, 1) IF @Char IN (' ', ';', ':', '!', '?', ',', '.', '_', '-', '/', '&','''','(') IF @Index + 1 <= LEN(@InputString) BEGIN IF @Char != '''' OR UPPER(SUBSTRING(@InputString, @Index + 1, 1)) != 'S' SET @OutputString = STUFF(@OutputString, @Index + 1, 1,UPPER(SUBSTRING(@InputString, @Index + 1, 1))) END SET @Index = @Index + 1 END RETURN ISNULL(@OutputString,'') END 

Chiamate di prova:

 select dbo.fnConvert_TitleCase(Upper('ÄÄ ÖÖ ÜÜ ÉÉ ØØ ĈĈ ÆÆ')) as test select dbo.fnConvert_TitleCase(upper('Whatever the mind of man can conceive and believe, it can achieve. – Napoleon hill')) as test 

risultati:

inserisci la descrizione dell'immagine qui

Se si sta utilizzando SSIS per l’importazione di dati con case miste e la necessità di eseguire una ricerca su una colonna con il caso corretto, si noterà che la ricerca fallisce laddove l’origine è mista e la fonte di ricerca è corretta. Noterai inoltre che non è ansible utilizzare le funzioni destra e sinistra come SSIS per SQL Server 2008r2 per le colonne derivate. Ecco una soluzione che funziona per me:

 UPPER(substring(input_column_name,1,1)) + LOWER(substring(input_column_name, 2, len(input_column_name)-1)) 

Il link che ho postato sopra è una big opzione che affronta il problema principale: non possiamo mai tener conto programmaticamente di tutti i casi (Smith-Jones, von Haussen, John Smith MD), almeno non in modo elegante. Tony introduce il concetto di carattere di eccezione / rottura per affrontare questi casi. Comunque, basandosi sull’idea di Cervo (tutti i caratteri più bassi preceduti dallo spazio), le istruzioni di sostituzione potrebbero essere racchiuse in una sostituzione basata su una singola tabella. In realtà, qualsiasi combinazione di caratteri basso / alto potrebbe essere inserita in @alpha e l’istruzione non cambierà:

 declare @str nvarchar(8000) declare @alpha table (low nchar(1), up nchar(1)) set @str = 'ALL UPPER CASE and SOME lower ÄÄ ÖÖ ÜÜ ÉÉ ØØ ĈĈ ÆÆ' -- stage the alpha (needs number table) insert into @alpha -- AZ / az select nchar(n+32), nchar(n) from dbo.Number where n between 65 and 90 or n between 192 and 223 -- append space at start of str set @str = lower(' ' + @str) -- upper all lower case chars preceded by space select @str = replace(@str, ' ' + low, ' ' + up) from @Alpha select @str 

Ecco una versione che utilizza una tabella di sequenza o numeri piuttosto che un ciclo. È ansible modificare la clausola WHERE per raggruppare le regole personali per quando convertire un carattere in maiuscolo. Ho appena incluso un semplice set che farà maiuscole qualsiasi lettera che è preceduta da una non-lettera ad eccezione degli apostrofi. Ciò significa come mai 123apple avrebbe una corrispondenza sulla “a” perché “3” non è una lettera. Se si desidera solo spazio bianco (spazio, tabulazione, ritorno a capo, avanzamento riga), è ansible sostituire il motivo '[^az]' con '[' + Char(32) + Char(9) + Char(13) + Char(10) + ']' .


 CREATE FUNCTION String.InitCap( @string nvarchar(4000) ) RETURNS nvarchar(4000) AS BEGIN -- 1. Convert all letters to lower case DECLARE @InitCap nvarchar(4000); SET @InitCap = Lower(@string); -- 2. Using a Sequence, replace the letters that should be upper case with their upper case version SELECT @InitCap = Stuff( @InitCap, n, 1, Upper( SubString( @InitCap, n, 1 ) ) ) FROM ( SELECT (1 + n1.n + n10.n + n100.n + n1000.n) AS n FROM (SELECT 0 AS n UNION SELECT 1 UNION SELECT 2 UNION SELECT 3 UNION SELECT 4 UNION SELECT 5 UNION SELECT 6 UNION SELECT 7 UNION SELECT 8 UNION SELECT 9) AS n1 CROSS JOIN (SELECT 0 AS n UNION SELECT 10 UNION SELECT 20 UNION SELECT 30 UNION SELECT 40 UNION SELECT 50 UNION SELECT 60 UNION SELECT 70 UNION SELECT 80 UNION SELECT 90) AS n10 CROSS JOIN (SELECT 0 AS n UNION SELECT 100 UNION SELECT 200 UNION SELECT 300 UNION SELECT 400 UNION SELECT 500 UNION SELECT 600 UNION SELECT 700 UNION SELECT 800 UNION SELECT 900) AS n100 CROSS JOIN (SELECT 0 AS n UNION SELECT 1000 UNION SELECT 2000 UNION SELECT 3000) AS n1000 ) AS Sequence WHERE n BETWEEN 1 AND Len( @InitCap ) AND SubString( @InitCap, n, 1 ) LIKE '[az]' /* this character is a letter */ AND ( n = 1 /* this character is the first `character` */ OR SubString( @InitCap, n-1, 1 ) LIKE '[^az]' /* the previous character is NOT a letter */ ) AND ( n < 3 /* only test the 3rd or greater characters for this exception */ OR SubString( @InitCap, n-2, 3 ) NOT LIKE '[az]''[az]' /* exception: The pattern ' should not capatolize the letter following the apostrophy */ ) -- 3. Return the modified version of the input RETURN @InitCap END 

Avrebbe senso mantenere una ricerca delle eccezioni per occuparsi di The von Neumann, McCain, DeGuzman e Johnson-Smith.

So che il diavolo è nei dettagli (specialmente quando si tratta di dati personali delle persone) e che sarebbe molto bello avere nomi correttamente in maiuscolo, ma il tipo di problema sopra descritto è il motivo per cui il pragmatico, attento al tempo, usa il seguente :

SELECT UPPER('Put YoUR O'So oddLy casED McWeird-nAme von rightHERE here')

Nella mia esperienza, le persone stanno bene vedendo IL NOME … anche quando è a metà frase.

Riferisca a: i Russi hanno usato una matita!

Penso che troverai che quanto segue è più efficiente:

 IF OBJECT_ID('dbo.ProperCase') IS NOT NULL DROP FUNCTION dbo.ProperCase GO CREATE FUNCTION dbo.PROPERCASE ( @str VARCHAR(8000)) RETURNS VARCHAR(8000) AS BEGIN SET @str = ' ' + @str SET @str = REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE( @str, ' a', ' A'), ' b', ' B'), ' c', ' C'), ' d', ' D'), ' e', ' E'), ' f', ' F'), ' g', ' G'), ' h', ' H'), ' i', ' I'), ' j', ' J'), ' k', ' K'), ' l', ' L'), ' m', ' M'), ' n', ' N'), ' o', ' O'), ' p', ' P'), ' q', ' Q'), ' r', ' R'), ' s', ' S'), ' t', ' T'), ' u', ' U'), ' v', ' V'), ' w', ' W'), ' x', ' X'), ' y', ' Y'), ' z', ' Z') RETURN RIGHT(@str, LEN(@str) - 1) END GO 

L’istruzione replace può essere tagliata e incollata direttamente in una query SQL. È molto brutto, tuttavia sostituendo @str con la colonna a cui sei interessato, non pagherai un prezzo per un cursore implicito come faresti con gli udfs così pubblicati. Trovo che anche usando la mia UDF è molto più efficiente.

Oh e invece di generare la dichiarazione di sostituzione a mano usa questo:

 -- Code Generator for expression DECLARE @x INT, @c CHAR(1), @sql VARCHAR(8000) SET @x = 0 SET @sql = '@str' -- actual variable/column you want to replace WHILE @x < 26 BEGIN SET @c = CHAR(ASCII('a') + @x) SET @sql = 'REPLACE(' + @sql + ', '' ' + @c+ ''', '' ' + UPPER(@c) + ''')' SET @x = @x + 1 END PRINT @sql 

Ad ogni modo dipende dal numero di righe. Vorrei che tu potessi semplicemente fare s / \ b ([az]) / uc $ 1 /, ma vabbè lavoriamo con gli strumenti che abbiamo.

NOTA dovresti usarlo come dovresti usarlo come .... SELECT dbo.ProperCase (LOWER (column)) poiché la colonna è in maiuscolo. Funziona in modo abbastanza veloce sulla mia tabella di 5.000 voci (nemmeno un secondo) anche con il più basso.

In risposta al turbinio di commenti riguardanti l'internazionalizzazione, presento la seguente implementazione che gestisce ogni carattere ASCII basandosi solo sull'implementazione di SQL Server in alto e in basso. Ricorda, le variabili che stiamo usando qui sono VARCHAR il che significa che possono contenere solo valori ASCII. Per utilizzare ulteriori alfabeti internazionali, devi utilizzare NVARCHAR. La logica sarebbe simile ma avresti bisogno di usare UNICODE e NCHAR al posto di ASCII e CHAR e la dichiarazione di sostituzione sarebbe molto più grande ....

 -- Code Generator for expression DECLARE @x INT, @c CHAR(1), @sql VARCHAR(8000), @count INT SEt @x = 0 SET @count = 0 SET @sql = '@str' -- actual variable you want to replace WHILE @x < 256 BEGIN SET @c = CHAR(@x) -- Only generate replacement expression for characters where upper and lowercase differ IF @x = ASCII(LOWER(@c)) AND @x != ASCII(UPPER(@c)) BEGIN SET @sql = 'REPLACE(' + @sql + ', '' ' + @c+ ''', '' ' + UPPER(@c) + ''')' SET @count = @count + 1 END SET @x = @x + 1 END PRINT @sql PRINT 'Total characters substituted: ' + CONVERT(VARCHAR(255), @count) 

Fondamentalmente la premessa del mio metodo è il trading pre-computing per l'efficienza. L'implementazione ASCII completa è la seguente:

 IF OBJECT_ID('dbo.ProperCase') IS NOT NULL DROP FUNCTION dbo.ProperCase GO CREATE FUNCTION dbo.PROPERCASE ( @str VARCHAR(8000)) RETURNS VARCHAR(8000) AS BEGIN SET @str = ' ' + @str SET @str = REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(@str, ' a', ' A'), ' b', ' B'), ' c', ' C'), ' d', ' D'), ' e', ' E'), ' f', ' F'), ' g', ' G'), ' h', ' H'), ' i', ' I'), ' j', ' J'), ' k', ' K'), ' l', ' L'), ' m', ' M'), ' n', ' N'), ' o', ' O'), ' p', ' P'), ' q', ' Q'), ' r', ' R'), ' s', ' S'), ' t', ' T'), ' u', ' U'), ' v', ' V'), ' w', ' W'), ' x', ' X'), ' y', ' Y'), ' z', ' Z'), ' š', ' Š'), ' œ', ' Œ'), ' ž', ' Ž'), ' à', ' À'), ' á', ' Á'), ' â', ' Â'), ' ã', ' Ã'), ' ä', ' Ä'), ' å', ' Å'), ' æ', ' Æ'), ' ç', ' Ç'), ' è', ' È'), ' é', ' É'), ' ê', ' Ê'), ' ë', ' Ë'), ' ì', ' Ì'), ' í', ' Í'), ' î', ' Î'), ' ï', ' Ï'), ' ð', ' Ð'), ' ñ', ' Ñ'), ' ò', ' Ò'), ' ó', ' Ó'), ' ô', ' Ô'), ' õ', ' Õ'), ' ö', ' Ö'), ' ø', ' Ø'), ' ù', ' Ù'), ' ú', ' Ú'), ' û', ' Û'), ' ü', ' Ü'), ' ý', ' Ý'), ' þ', ' Þ'), ' ÿ', ' Ÿ') RETURN RIGHT(@str, LEN(@str) - 1) END GO 

È troppo tardi per tornare indietro e ottenere i dati non maiuscoli?

I prodotti di von Neumann, McCain, DeGuzman e Johnson-Smith della tua base clienti potrebbero non gradire il risultato del tuo processo …

Inoltre, sto indovinando che questo è destinato ad essere un aggiornamento una tantum dei dati? Potrebbe essere più facile esportare, filtrare / modificare e reimportare i nomi corretti nel db, e quindi puoi usare approcci non SQL per nominare il fixing …

Ecco un’altra variante che ho trovato nei forum di SQLTeam.com @ http://www.sqlteam.com/forums/topic.asp?TOPIC_ID=47718

 create FUNCTION PROPERCASE ( --The string to be converted to proper case @input varchar(8000) ) --This function returns the proper case string of varchar type RETURNS varchar(8000) AS BEGIN IF @input IS NULL BEGIN --Just return NULL if input string is NULL RETURN NULL END --Character variable declarations DECLARE @output varchar(8000) --Integer variable declarations DECLARE @ctr int, @len int, @found_at int --Constant declarations DECLARE @LOWER_CASE_a int, @LOWER_CASE_z int, @Delimiter char(3), @UPPER_CASE_A int, @UPPER_CASE_Z int --Variable/Constant initializations SET @ctr = 1 SET @len = LEN(@input) SET @output = '' SET @LOWER_CASE_a = 97 SET @LOWER_CASE_z = 122 SET @Delimiter = ' ,-' SET @UPPER_CASE_A = 65 SET @UPPER_CASE_Z = 90 WHILE @ctr <= @len BEGIN --This loop will take care of reccuring white spaces WHILE CHARINDEX(SUBSTRING(@input,@ctr,1), @Delimiter) > 0 BEGIN SET @output = @output + SUBSTRING(@input,@ctr,1) SET @ctr = @ctr + 1 END IF ASCII(SUBSTRING(@input,@ctr,1)) BETWEEN @LOWER_CASE_a AND @LOWER_CASE_z BEGIN --Converting the first character to upper case SET @output = @output + UPPER(SUBSTRING(@input,@ctr,1)) END ELSE BEGIN SET @output = @output + SUBSTRING(@input,@ctr,1) END SET @ctr = @ctr + 1 WHILE CHARINDEX(SUBSTRING(@input,@ctr,1), @Delimiter) = 0 AND (@ctr <= @len) BEGIN IF ASCII(SUBSTRING(@input,@ctr,1)) BETWEEN @UPPER_CASE_A AND @UPPER_CASE_Z BEGIN SET @output = @output + LOWER(SUBSTRING(@input,@ctr,1)) END ELSE BEGIN SET @output = @output + SUBSTRING(@input,@ctr,1) END SET @ctr = @ctr + 1 END END RETURN @output END GO SET QUOTED_IDENTIFIER OFF GO SET ANSI_NULLS ON GO 

Ho appena saputo di InitCap() .

Ecco alcuni esempi di codice:

 SELECT ID ,InitCap(LastName ||', '|| FirstName ||' '|| Nvl(MiddleName,'')) AS RecipientName FROM SomeTable 

Questo ha funzionato in SSMS:

 Select Jobtitle, concat(Upper(LEFT(jobtitle,1)), SUBSTRING(jobtitle,2,LEN(jobtitle))) as Propercase From [HumanResources].[Employee]