분류 전체보기

· 기타
개요 이번에 새로 추가한 기능에 대한 결과가 어땟어? 와 같은 내용을 증명하려면 인과추론에 대한 지식이 있어야한다. 상관관계와 인과관계 상관관계 두 변수가 얼마나 상호 의존적인지 파악하는 것을 의미 한 변수가 증가하면 다른 변수도 따라서 증가 혹은 감소하는가? 역인과관계의 오류 평소 특정 원인과 결과에서 관계가 존재한다 혹은 존재하지 않는다로만 판단하여, 의사결정하는 경우가 많음. 대표적으로 상관관계만으로 잘못된 판단한 사례중 1940년대 보건 전문가의 소아마비와 아이스크림 섭취간의 연구결과가 있음 당시 보건 전문가는 소아마비와 아이스크림 섭취량에 상관관계가 있음을 발견하고 소아마비 예방을 위해 아이스크림 섭취량을 줄일 것을 권고함 하지만 소아마비는 여름에 많이 발병하고 아이스크림 또한 여름에 판매량이 ..
개요 본문에서는 파이썬의 sort() 및 sorted() 함수에 적용된 TimSort 알고리즘에 대해 설명하고자 합니다. TimSort는 삽입 정렬(Insertion Sort)과 병합 정렬(Merge Sort)의 특성을 결합하여 구현된 고도로 효율적인 정렬 알고리즘입니다. 이 글에서는 TimSort의 작동 원리와 그 구성 방식에 대해 간략히 소개하겠습니다. Binary insertion sort 특징 안정 정렬 비교 횟수가 Insertion sort에 비해 적음 Insertion sort 는 비교하는 연산에 최대 O(N^2) 시간이 소요됩니다. 반면 Binary insertion sort는 이러한 비교 연산 O(NlogN) 으로 줄일 수 있는데 어떻게 줄일 수 있는지 insertion sort의 특징과 ..
· 네트워크
Background Describe certificate-bound access and refresh tokens using mutual Transport Layer Security with X.509 certificates Client provided a mechanism for authentication to the authorization server using mutual TLS self-signed certificates or public key infrastructure (PKI) Ensuring that such an access token presented to it was issued to the client presenting the token. https://www.rfc-editor..
개요 데이터베이스간의 데이터를 분리할 경우 데이터베이스 하나의 트랜잭션을 사용하여 상태 변화를 ACID 원칙에 따라서 보장할 수 없다. 이를 해결하기 위한 방안이 있다 Two Phase Commit 여러 노드들 상에서의 원자적 트랜잭션 커밋을 이루기 위한 알고리즘 또는 프로토콜 탄생 배경 싱글 노드에서 실행되는 데이터베이스의 원자성은 보통 스토리지 엔진에 의해 구현됨. 클라이언트가 데이터베이스 노드에 요청하면, 데이터베이스는 트랜잭션이 durable 하게 write 될 수 있도록 보장함 (write-ahead. log) 만약 쓰기 연산이 실패하면 log 로 부터 트랜잭션을 recovery 함. 싱글 노드 상에서, 트랜잭션 커밋은 데이터가 디스크에 쓰여진 순서에 의존하게됨. 트랜잭션의 성공여부는 커밋 레코..
· 인공지능
경사 하강 알고리즘이란 경사 하강 알고리즘은 비용 함수 J 를 최소화 하는 θ를 구하는 알고리즘입니다. 과정은 아래와 같습니다 θ에 대해 임의의 초기값을 설정합니다. J 가 최소가 될때 가지 θ 갱신을 반복하며 최솟값에 도달했을 때 해당하는 θ 값을 찾습니다. 갱신 직전 값과 갱신 값이 같을 때 종료됩니다. 미분을 하는 이유 미분 값은 특정 지점에서의 기울기를 의미합니다. Global minima 지점이 있을 때 특정 θ 값에서 기울기가 양수이면 기울기의 반대 방향으로 θ 값을 변형시키면 최소값 지점으로 이동시킬 수 있습니다. Learning Rate (학습 속도) Learning Rate 가 지나치게 작을 때와 클 때를 비교해보겠습니다. https://www.jeremyjordan.me/nn-learn..
· 논문리뷰
Abstract 해당 논문은 두 모델 (생성자와 판별자) 간의 경쟁 관계를 통해 training 데이터의 분포와 유사한 이미지를 생성하는 방법을 기술하고 있다 Model Generative model G 로 표기하며 training data 의 분포를 묘사한다. Discriminaive model 이 생성한 이미지를 구분하지 못하도록 학습한다. Discriminative model 샘플 데이터가 진짜(학습 데이터) 인지 가짜(생성한 데이터) 인지 구분하는 모델이다. 진짜 데이터일 확률을 추정한다. 학습과정 G는 D가 실제 데이터와 생성 데이터를 판별하는데 실수할 확률을 최대화 하는 방향으로 학습한다. minimax two player game D는 생성 데이터를 가짜로 잘 판별하는 것을 목표로 학습한다...
· MLOps
What is ONNX 오픈 신경망 교환(ONNX)은 모든 유형의 머신러닝 또는 딥러닝 모델을 표현하도록 설계된 개방형 형식입니다. 머신 러닝 학습의 결과는 입력 데이터와 출력 예측 간의 관계를 나타내는 모델 파일입니다. 이러한 모델은 파이토치, 텐서플로우 등 다양한 프레임워크를 사용하여 학습할 수 있습니다. 이러한 프레임워크는 각각 다른 형식으로 학습된 모델을 생성하므로 다양한 소프트웨어 환경에서 사용할 수 있도록 이식성이 떨어집니다. ONNX 포맷은 머신러닝 프레임워크 간의 중간 역할을 하는 통일된 포맷을 제공함으로써 프레임워크 상호 운용성을 가능하게 합니다. 이러한 상호 운용성 덕분에 학습된 모델을 다양한 소프트웨어 플랫폼에 쉽게 배포할 수 있습니다. IOS 배포 시나리오 iOS 앱을 통해 학습된 ..
· 기타
개요 UGC(User Generate Content) 란 유저가 서비스를 사용할 때 생성한 멀티 미디어 데이터를 뜻한다. 많은 기업에서는 생성한 데이터를 정제하는 것에 많은 리소스를 쏟는다. Why is UGC moderation Important 많은 기업들은 기업의 성장을 위해 유저가 컨텐츠를 생성하는 것에 대해 많은 권한을 부여한다. 하지만 일부 유저들은 기업이 바라는 컨텐츠가 아닌 부적절한 컨텐츠를 생성한다. 이는 곧 서비스의 퀄리티를 떨어트리기 때문에 기업에서는 사용자 생성 콘텐츠를 면밀히 모니터링해야 할 필요가 생긴다. What are the biggest challenges with moderating UGC? 오늘날 대부분의 콘텐츠 검토는 사후 대응적인 성격이 강함. 즉, 사이트나 브랜드의..
파커초
'분류 전체보기' 카테고리의 글 목록 (3 Page)