[알고리즘][2] H-Index

2023. 8. 11. 12:40알고리즘 풀이

문제 설명
H-Index는 과학자의 생산성과 영향력을 나타내는 지표입니다. 어느 과학자의 H-Index를 나타내는 값인 h를 구하려고 합니다. 위키백과1에 따르면, H-Index는 다음과 같이 구합니다.

어떤 과학자가 발표한 논문 n편 중, h번 이상 인용된 논문이 h편 이상이고 나머지 논문이 h번 이하 인용되었다면 h의 최댓값이 이 과학자의 H-Index입니다.

어떤 과학자가 발표한 논문의 인용 횟수를 담은 배열 citations가 매개변수로 주어질 때, 이 과학자의 H-Index를 return 하도록 solution 함수를 작성해주세요.

제한사항
과학자가 발표한 논문의 수는 1편 이상 1,000편 이하입니다.
논문별 인용 횟수는 0회 이상 10,000회 이하입니다.
입출력 예
citations	return
[3, 0, 6, 1, 5]	3
입출력 예 설명
이 과학자가 발표한 논문의 수는 5편이고, 그중 3편의 논문은 3회 이상 인용되었습니다. 그리고 나머지 2편의 논문은 3회 이하 인용되었기 때문에 이 과학자의 H-Index는 3입니다.

문제가 잘 안풀린다면😢
힌트가 필요한가요? [코딩테스트 연습 힌트 모음집]으로 오세요! → 클릭

※ 공지 - 2019년 2월 28일 테스트 케이스가 추가되었습니다.

나의 풀이

- 구현하라고 하는대로 하면 되는 문제

- 단 정렬로 시간 축소는 필요한 문제

def solution(citations):
    # 시뮬레이션이 섞인 구현 문제
    # 0부터 최대 인용까지 돌면서 h의 최댓값을 갱신해 가면 된다
    # 단 만약 최대 인용이 10,000이고 논문의 수가 1000편이면 총 10,000,000이므로 빠듯하다
    # 이를 최소화하기 위해 정렬 활용
    
    # 큰 것 순으로 정렬
    citations.sort(reverse=True)
    max_citation = citations[0]
    max_h = 0
    for i in range(0, max_citation+1):
        h = i
        ct = 0
        for ele in citations:
            if ele >= h:
                ct += 1
            # 현재 ele가 h보다 작다면 뒤의 ele도 작으므로 break
            else:
                break
        if ct >= h:
            max_h = max(max_h, h)
    
    return max_h

이건 이전에 했던 풀이를 참고한 풀이다

- ct >= h가 아니게 되는 순간은 그 위로 가봤자 ct는 그 미만인데 h는 그 초과이니 또한 저게 성립하지 않는다. 그러니 break를 해주어도 되는 것이다.

- 이것만 해도 속도가 최대 10,000배 빨라진다

def solution(citations):
    # 시뮬레이션이 섞인 구현 문제
    # 0부터 최대 인용까지 돌면서 h의 최댓값을 갱신해 가면 된다
    # 단 만약 최대 인용이 10,000이고 논문의 수가 1000편이면 총 10,000,000이므로 빠듯하다
    # 이를 최소화하기 위해 정렬 활용
    
    # 큰 것 순으로 정렬
    citations.sort(reverse=True)
    max_citation = citations[0]
    max_h = 0
    for i in range(0, max_citation+1):
        h = i
        ct = 0
        for ele in citations:
            if ele >= h:
                ct += 1
            # 현재 ele가 h보다 작다면 뒤의 ele도 작으므로 break
            else:
                break
        if ct >= h:
            max_h = max(max_h, h)
	# 추가한 코드
        else:
            break
    
    return max_h