알고리즘 풀이/SQL

[SQL][3] 중복 제거하기

Dong's Universe 2023. 11. 7. 00:11
문제 설명
ANIMAL_INS 테이블은 동물 보호소에 들어온 동물의 정보를 담은 테이블입니다. ANIMAL_INS 테이블 구조는 다음과 같으며, ANIMAL_ID, ANIMAL_TYPE, DATETIME, INTAKE_CONDITION, NAME, SEX_UPON_INTAKE는 각각 동물의 아이디, 생물 종, 보호 시작일, 보호 시작 시 상태, 이름, 성별 및 중성화 여부를 나타냅니다.

NAME	TYPE	NULLABLE
ANIMAL_ID	VARCHAR(N)	FALSE
ANIMAL_TYPE	VARCHAR(N)	FALSE
DATETIME	DATETIME	FALSE
INTAKE_CONDITION	VARCHAR(N)	FALSE
NAME	VARCHAR(N)	TRUE
SEX_UPON_INTAKE	VARCHAR(N)	FALSE
동물 보호소에 들어온 동물의 이름은 몇 개인지 조회하는 SQL 문을 작성해주세요. 이때 이름이 NULL인 경우는 집계하지 않으며 중복되는 이름은 하나로 칩니다.

예시
예를 들어 ANIMAL_INS 테이블이 다음과 같다면

ANIMAL_ID	ANIMAL_TYPE	DATETIME	INTAKE_CONDITION	NAME	SEX_UPON_INTAKE
A562649	Dog	2014-03-20 18:06:00	Sick	NULL	Spayed Female
A412626	Dog	2016-03-13 11:17:00	Normal	*Sam	Neutered Male
A563492	Dog	2014-10-24 14:45:00	Normal	*Sam	Neutered Male
A513956	Dog	2017-06-14 11:54:00	Normal	*Sweetie	Spayed Female
보호소에 들어온 동물의 이름은 NULL(없음), *Sam, *Sam, *Sweetie입니다. 이 중 NULL과 중복되는 이름을 고려하면, 보호소에 들어온 동물 이름의 수는 2입니다. 따라서 SQL문을 실행하면 다음과 같이 나와야 합니다.

count
2
※ 컬럼 이름(위 예제에서는 count)은 일치하지 않아도 됩니다.

본 문제는 Kaggle의 "Austin Animal Center Shelter Intakes and Outcomes"에서 제공하는 데이터를 사용하였으며 ODbL의 적용을 받습니다.

나의 풀이

- distinct는 null 값을 제외해주지 않는다

- count가 null값을 제외해 준다.

select count(distinct(name)) as count from animal_ins

 

Reference


https://tawool.tistory.com/152

 

[SQL] Null 주의 사항

1. null 값에 정수형 연산을 하게 되면 null이 된다. null == 12 * 34 * null - 이것에 대해 실수를 하지 않으려면 정수형 컬럼에 기본값을 주거나, NVL 같은 함수를 사용하여 Null 값을 다른 정수형 값으로

tawool.tistory.com