short terms
-
Kimball’s Dimensional Modeling 차원 모델링은 데이터 웨어하우스레벨에서 유용한 데이터 모델링 기법입니다.Star Schema로 데이터를 정의하는 기법으로, 기존의 테이블을 변경하지 않고 새로운 컬럼을 추가하는 것과 같은 효과를 누릴 수 있게 합니다. 즉, 확장성과 재사용성 면에서 뛰어난 장점이 있습니다. 1. Design Process설계 프로세스는 다음 네 단계로 정의할 수 있습니다. business Process 를 정의Fact의 성능 메트릭을 생성하거나 캡쳐하는 단계e.g.) 주문접수, 보험청구, 수강생 등록 등 운영 활동grain 을 정의데이터를 유일하게 식별하는 식별자 → PK 또는 여러 키의 조합(하단 링크)이 될 수 있음Fact Table Surrogate Key | ..
Kimball’s Dimensional ModelingKimball’s Dimensional Modeling 차원 모델링은 데이터 웨어하우스레벨에서 유용한 데이터 모델링 기법입니다.Star Schema로 데이터를 정의하는 기법으로, 기존의 테이블을 변경하지 않고 새로운 컬럼을 추가하는 것과 같은 효과를 누릴 수 있게 합니다. 즉, 확장성과 재사용성 면에서 뛰어난 장점이 있습니다. 1. Design Process설계 프로세스는 다음 네 단계로 정의할 수 있습니다. business Process 를 정의Fact의 성능 메트릭을 생성하거나 캡쳐하는 단계e.g.) 주문접수, 보험청구, 수강생 등록 등 운영 활동grain 을 정의데이터를 유일하게 식별하는 식별자 → PK 또는 여러 키의 조합(하단 링크)이 될 수 있음Fact Table Surrogate Key | ..
2023.07.18 -
Meta(Facebook)의 새로운 언어 AI 모델인 NLLB(https://github.com/facebookresearch/fairseq/tree/nllb) 를 구현하기 위해서는 메타가 쓰는 언어 코드인 FLORES-200을 맞춰야 한다. 현재 NLLB는 자동 언어 인식기능이 없기 때문에, LibreTranslator와 같은 서드파티 번역을 이용해 언어 인식을 먼저 해야 하는데 눈씻고 찾아봐도 거의 대부분 언어 번역기가 사용하는 ISO 639 표준(2~3자리 영어 코드)과 FLORES-200 표준의 연동은 찾기 힘들다. 그래서! https://github.com/facebookresearch/flores/blob/main/flores200/README.md https://ko.wikipedia.org..
Language Code, ISO 639, FLORES-200Meta(Facebook)의 새로운 언어 AI 모델인 NLLB(https://github.com/facebookresearch/fairseq/tree/nllb) 를 구현하기 위해서는 메타가 쓰는 언어 코드인 FLORES-200을 맞춰야 한다. 현재 NLLB는 자동 언어 인식기능이 없기 때문에, LibreTranslator와 같은 서드파티 번역을 이용해 언어 인식을 먼저 해야 하는데 눈씻고 찾아봐도 거의 대부분 언어 번역기가 사용하는 ISO 639 표준(2~3자리 영어 코드)과 FLORES-200 표준의 연동은 찾기 힘들다. 그래서! https://github.com/facebookresearch/flores/blob/main/flores200/README.md https://ko.wikipedia.org..
2022.11.25 -
- Not a Number라는 뜻으로, Python의 notation 중 하나이다. - 이게 보이면 원인을 찾아서 해결하는 것이 좋다. - 보통 Infinity value로 인해 생겨난다. - NaN과 연관된 연산은 죄다 NaN이 되므로 골치아프다. zero devide by zero (0/0) Infinity devide by Infinity (Inf/Inf) Inf-Inf, -Inf-Inf, -Inf+Inf (Inf+Inf = Inf) zero multiplied by Infinity, Infinity multiplied by zero (0*Inf, Inf*0) x
NaN- Not a Number라는 뜻으로, Python의 notation 중 하나이다. - 이게 보이면 원인을 찾아서 해결하는 것이 좋다. - 보통 Infinity value로 인해 생겨난다. - NaN과 연관된 연산은 죄다 NaN이 되므로 골치아프다. zero devide by zero (0/0) Infinity devide by Infinity (Inf/Inf) Inf-Inf, -Inf-Inf, -Inf+Inf (Inf+Inf = Inf) zero multiplied by Infinity, Infinity multiplied by zero (0*Inf, Inf*0) x
2021.05.24 -
- 스트리밍 데이터 : 실시간 데이터 >> 시계열 데이터를 포함할 수도 있고, 아닐 수도 있다. >> 단지 실시간 데이터 처리를 함으로써, 시계열 데이터에서 중요한 데이터 순서 등 시계열 데이터 정보가 온전하지 않을 수 있다. - 시계열 데이터 : 순서 데이터
[draft] Streaming VS Time series- 스트리밍 데이터 : 실시간 데이터 >> 시계열 데이터를 포함할 수도 있고, 아닐 수도 있다. >> 단지 실시간 데이터 처리를 함으로써, 시계열 데이터에서 중요한 데이터 순서 등 시계열 데이터 정보가 온전하지 않을 수 있다. - 시계열 데이터 : 순서 데이터
2021.05.17 -
Dialect란? 방언 SQL의 표준은 ANSI, 그러나 각 DBMS Vendor마다 추가적인 SQL이 존재 다른 DBMS Vendors을 JPA에서 사용할 때, Dialect 설정으로 간단하게 쿼리 변환이 가능 Reference tistory blog, https://dololak.tistory.com/465
Dialect (JPA hibernate)Dialect란? 방언 SQL의 표준은 ANSI, 그러나 각 DBMS Vendor마다 추가적인 SQL이 존재 다른 DBMS Vendors을 JPA에서 사용할 때, Dialect 설정으로 간단하게 쿼리 변환이 가능 Reference tistory blog, https://dololak.tistory.com/465
2021.05.07 -
공통점 메모리를 아끼기 위해 Object Caching을 조정 Eviction Cached Object를 삭제하는 방법 LRU, LIRS 등 메커니즘 Passivation Eviction의 대상 Object를 File에 우선 저장 후 삭제 이후 Object를 다시 필요로 할 때, 해당 File에서 reload Expiration 일정 시간이 지나면(Expired) Cached Object를 삭제 Reference tistory blog, https://jhouse0317.tistory.com/39
Eviction, Passivation, Expiration공통점 메모리를 아끼기 위해 Object Caching을 조정 Eviction Cached Object를 삭제하는 방법 LRU, LIRS 등 메커니즘 Passivation Eviction의 대상 Object를 File에 우선 저장 후 삭제 이후 Object를 다시 필요로 할 때, 해당 File에서 reload Expiration 일정 시간이 지나면(Expired) Cached Object를 삭제 Reference tistory blog, https://jhouse0317.tistory.com/39
2021.05.07 -
정의 한 객체의 메모리에서 표현방식을 저장 또는 전송에 적합한 다른 데이터 형식으로 변환하는 과정 - [1] 객체 통신 또는 통신 단순화를 위해 사용 - [1] 직렬화와 비슷한 개념이며, Unmarshalling도 있음 - [1] Python에서는 Serialization이랑 같은 개념으로 취급 - [1] Java에서는 Java Object를 byte stream으로 변환하는 과정 또는 XML 문서로 변환하는 과정 - [2] Serialization은 Object가 대상, Marshalling은 대상이 한정되지 않음(변환이 목표) - [3] 서로 다른 언어 간 데이터 전송은 Marshalling Reference 위키백과 "마샬링", https://ko.wikipedia.org/wiki/%EB%A7%88..
마샬링 (Marshalling)정의 한 객체의 메모리에서 표현방식을 저장 또는 전송에 적합한 다른 데이터 형식으로 변환하는 과정 - [1] 객체 통신 또는 통신 단순화를 위해 사용 - [1] 직렬화와 비슷한 개념이며, Unmarshalling도 있음 - [1] Python에서는 Serialization이랑 같은 개념으로 취급 - [1] Java에서는 Java Object를 byte stream으로 변환하는 과정 또는 XML 문서로 변환하는 과정 - [2] Serialization은 Object가 대상, Marshalling은 대상이 한정되지 않음(변환이 목표) - [3] 서로 다른 언어 간 데이터 전송은 Marshalling Reference 위키백과 "마샬링", https://ko.wikipedia.org/wiki/%EB%A7%88..
2021.05.07 -
예시 가족이 휴가를 떠나는 동안, 가족의 반려동물을 대신 돌봐줄 사람을 가정 - [1] Authentication 집열쇠, 또는 출입 시스템에 등록된 ID 시스템이 올바른 자격증명을 가진 User에게만 Access 권한을 부여하는 방식 Authorization 집안에서 부엌에 접근하고, 반려동물의 사료가 들어있는 찬장을 열 수 있는 권한을 부여 침실에 접근할 수 있는 권한은 없음 예약된 호텔에 체크인하는 여행객을 가정 - [2] Authentication 여권 또는 신분증을 제시하여 예약 확인 Authorization Authentication을 통과한 후, 호텔 직원이 Key Card를 제공 Key Card를 통해 엘리베이터, 수영장, 부여된 침실 등에 접근 가능 Key Card에서 허용되지 않은 직원..
[draft] Authentication VS Authorization예시 가족이 휴가를 떠나는 동안, 가족의 반려동물을 대신 돌봐줄 사람을 가정 - [1] Authentication 집열쇠, 또는 출입 시스템에 등록된 ID 시스템이 올바른 자격증명을 가진 User에게만 Access 권한을 부여하는 방식 Authorization 집안에서 부엌에 접근하고, 반려동물의 사료가 들어있는 찬장을 열 수 있는 권한을 부여 침실에 접근할 수 있는 권한은 없음 예약된 호텔에 체크인하는 여행객을 가정 - [2] Authentication 여권 또는 신분증을 제시하여 예약 확인 Authorization Authentication을 통과한 후, 호텔 직원이 Key Card를 제공 Key Card를 통해 엘리베이터, 수영장, 부여된 침실 등에 접근 가능 Key Card에서 허용되지 않은 직원..
2021.04.30