[Algorithm] 탐욕 알고리즘 - 허프만 코드 (Huffman Code)

August 28, 2020 Dawoon Jeong

탐욕 알고리즘 - Huffman Code (허프만 코드)

Huffman의 탐욕 알고리즘은 각 문자의 발생 빈도 테이블을 사용하여 각 문자를 이진 문자열로 표현하는 최적의 방법을 구축
Huffman의 코딩은 코드 길이가 해당 문자의 상대적 빈도 또는 가중치에 따라 달라 지도록 문자에 코드를 제공

장점

데이터는 Huffman 코드를 사용하여 효율적으로 인코딩 될 수 있음
데이터를 압축하는 데 널리 사용되고 유익한 기술

압축 방법

Fixed Length code (고정 길이 코드)

동일한 비트 수로 표시되는 각 문자
문자 당 최소 3 비트

10⁵자 파일의 경우 3 x 10⁵ 비트 가 필요
prefix가 없는 binary code는 leaf에 저장된 인코딩 된 문자와 함께 binary tree로 표시되거나 시각화 될 수 있음

Prefix Code(접두사 코드)

저장공간을 절약하기 위한 방법인 Variable Length Code (가변 길이 코드)의 한 방법
접두사 코드는 인코딩과 디코딩을 명확히하기 때문에 바람직 함
파일의 각 문자를 설명하는 코드 단어를 연결하여 인코딩
인코딩 된 데이터로 시작하는 코드 워드는 명확하기 때문에 디코딩도 간단 함

특징

Huffman tree 또는 Huffman 코딩 트리는 트리의 각 leaf이 주어진 알파벳의 문자에 해당하는 full bianry 정의 됨
Huffman 트리는 최소 외부 경로 가중치와 관련된 binary tree로 취급 됨
주어진 leaf set에 대한 가중치 경로 길이의 최소 합과 관련된 것이며, 목표는 최소 외부 경로 가중치로 트리를 만드는 것

references

https://www.javatpoint.com/greedy-algorithms
https://www.javatpoint.com/huffman-coding
https://www.geeksforgeeks.org/greedy-algorithms/
https://www.geeksforgeeks.org/huffman-coding-greedy-algo-3/
https://www.tutorialspoint.com/huffman-trees-in-data-structure

Share on

Twitter Facebook LinkedIn

You may also enjoy

[Spring] ORM, JPA, hibernate, iBatis/MyBatis 개념 및 차이점

June 09, 2021 Dawoon Jeong

ORM 기술도 트렌드가 변화하고있다. 한참동안은 MyBatis가 대세를 이루더니 요즘은 JPA+JPQL 이 대세라고 한다. MyBatis는 동적쿼리를 작성할 때 xml로 태그를 열고 닫아야 하는 귀찮은 부분이 분명 있었지만, SQL을 직접작성하다보니 쿼리를 볼 ...

[Spring] Spring VS Spring boot VS Spring MVC 개념 및 차이점

May 24, 2021 Dawoon Jeong

요즘 spring boot가 스프링진영에서 제일 많이 쓰인다고 한다. 듣기만 했지 이것 또한 실무에서 만나본 적이 없다. (생각보다 한 번 개발된 서비스는 쉽게 변하지 않는다.) 최근에 개인 프로젝트를 진행하면서 사용하고 있는데 셋팅도 쉽고 여러모로 스프링 보다 ...

[Spring] Maven VS Gradle 개념, 비교

May 20, 2021 Dawoon Jeong

빌드 자동화 도구로 maven 과 gradle 대표적인다. 오랫동안 maven이 대세였다면 최근 몇년간 gradle로 추세가 변하고 있다고 한다. 그러나 난 아직도 실무에서 써본적이 없다. 그래서 최근에 개인 프로젝트를 진행하면서 gradle을 써보았는데, 복잡한...

[Spring] Spring MVC

April 30, 2021 Dawoon Jeong

Spring MVC는 웹 애플리케이션을 빌드하는 데 사용되는 Java 프레임 워크 MVC 디자인 패턴 Inversion of Control, Dependency Injection과 같은 핵심 스프링 프레임 워크의 모든 기본 기능을 구현 Dispat...